У меня есть CSV-файл, разделенный запятыми, с тремя столбцами:
"Date", "URL", "Views"
и я пытаюсь извлечь определенные строки, которые содержат определенные ключевые слова в столбце URL, например, слово charger.
import pandas as pd
keywords = {"charger"}
df = pd.read_csv("original_file.csv", sep=",")
listMatchURL = []
for i in range(len(df.index)):
if any(x in df['URL'][i] for x in keywords):
listMatchURL.append(df['URL'][i])
output = pd.DataFrame({'URL': listMatchURL})
output.to_csv("new_file.csv", index=False)
Это записывает в новый CSV-файл всю строку URL-адреса, содержащую ключевое слово. Но как я могу извлечь и написать только ключевое слово, а не весь URL-адрес? Я не хочу извлекать все http://www.example.com/search/iphone+charger.html, а просто charger.
А также, как я могу сохранить два других соответствующих столбца Date и Views в новом CSV-файле, который я пишу? На данный момент он извлекает только столбец URL.
Я хочу получить новый файл csv со столбцами:
"Date", "Keyword", "Views"