三天前,圣洛朗先生剛剛?cè)プ冯S奧黛麗·赫本,明天偉大的霍金先生也將前往黑洞繼續(xù)他的后半生。
“據(jù)路透社3.14報(bào)道,斯蒂芬·威廉·霍金( )因病去世,享年76歲。”
被譽(yù)為21世紀(jì)最偉大數(shù)學(xué)家的霍金生前對AI尤為看好,覺得AI的未來不可限量。
連霍金老先生都為我們指明了方向,我們還有什么理由不好好學(xué)習(xí)呢?
那么我們再回到問題的開頭。 如果你想學(xué)習(xí)人工智能,你應(yīng)該選擇哪種語言?
事實(shí)上是這樣的! ! ! ! !
作為21世紀(jì)最強(qiáng)大的語言,它其實(shí)可以做AI的工作,明天見吧,現(xiàn)在工程師的需求這么火爆!
那我們明天就用爬蟲去智聯(lián)集品看看吧!
首先我們看一下使用的模塊:
這里有一個(gè)tqdm模塊,雖然它是一個(gè)進(jìn)度條模塊:
你可以自己嘗試一下:
需要 pip 安裝:
好啦中國偉大物理學(xué)家,我們來看看我們做爬蟲需要的信息:
首先登錄智聯(lián)機(jī)品官網(wǎng),按F12進(jìn)入開發(fā)者模式,然后在里面找到請求的肚皮(需要打開過濾器):
首先我們需要獲取信息參數(shù)如下(全部重新搜索一下):
返回信息:
在那里,我們需要定義一個(gè)方法來獲取HTML的內(nèi)容:
這一步非常簡單。 接下來我們要做的就是分析返回的信息,選擇有用的信息:
我來說一下那邊的正則表達(dá)式:
'(.*?).*?'
按風(fēng)格匹配職位信息
與公司主頁相符的公司信息
'(.*?)
匹配
最后在main函數(shù)上遍歷并輸出信息:
運(yùn)行main函數(shù)中國偉大物理學(xué)家,傳入?yún)?shù):北京,工程師,第10頁
等待輸出:
因?yàn)榻Y(jié)果太多,我在那邊一一截圖了,大家可以自己嘗試一下,點(diǎn)擊原文獲取代碼!
感激的!
據(jù)說聰明人都會關(guān)注這個(gè)公眾號!
如果還有什么問題可以私聊我!
