列印 PAA 問題
如您所看到的,該工具以 JSON 資料的形式傳回整個 SERP,並且與查詢相關的主要問題位於「lated_questions」鍵中。
由於我們獲取的是結構化資料而
不是原始 HTML 數據,因此我們可以透過鍵名選擇特定元素:
serp = response.json() all_questions = serp[‘related_questions’] for paa in all_questions: print(paa[‘question’])
我們將整個 JSON 回 紐西蘭電報數據 應儲存在 serp 變數中
我們檢索「相關問題」並建立一個元素清單 – 其中每個元素都是 PAA 問題。
為了檢索問題,我們循環遍歷列表並僅列印“問題”鍵。
結果是控制台上列印出 PAA 問題清單:
控制台內的 PAA 問題
步驟 4:將資料匯出到 CSV 文件
對於 CSV 文件,我們可能還想將關鍵字與 PAA 問題相匹配,所以讓我們下載它:
keyword = serp[‘search_information’][‘query_displayed’]
完成此操作後,我們將建立一個空列表,用於根據需要格式化資料:
paa_questions = []
我們將提取 最佳 10 名印地語網站和博客 的資訊添加到其中:
for paa in all_questions: paa_questions.append({ ‘Keyword’: keyword, ‘Related Question’: paa[‘question’] })
如果我們列印 paa_questions,控制台中的內容如下:
列印 PAA 問題
這很重要,因為它是 CSV 檔案 銷售艾 的基礎,當我們將抓取工具擴展到數千個關鍵字時,它將幫助我們識別問題的來源。
在最後一步中,讓我們使用 Pandas 建立一個 CSV 檔案以便於匯出:
db = pd.DataFrame(paa_questions) db.to_csv(‘paa_questions.csv’, index=False)
如果您現在運行程式碼,它不會在控制台上列印任何內容。相反,它將創建一個新的 CSV 文件,如下所示:
運行程式碼
第 5 步:大規模收集 PAA 問題
當然,僅針對一個關們該如何擴展這個項目呢?
嗯,這就是網頁抓取的美妙之處。這都是關於循環的!
首先,建立一個包含您所需關鍵字的清單:
keywords = { ‘keyword+research’, ‘keyword+tracker’ }
然後,我們將把之前的所有程式碼放入一個新循環中,該循環將從關鍵字列表中獲取每個術語並運行整個過程。
這是最終且完整的程式碼片段: