裸で独りぼっち

マジの日記

Python2年生

Pyhton2年生勉強第二章_HTMLの解析

・Beautiful soupでHTMLタグから必要な要素データを取り出せる。 米Beautifulsoupの由来は不思議の国のアリスに出てくる詩 ごちゃごちゃのHTMLスープからおいしい要素を見つけ出す 【1】BeautifulSoupとrequestsを組み合わせて解析を行う。 load_url html.pa…

Pyhton2年生勉強第一章_スクレイピングの基礎(テキストの取得)

前提 ・クローリングは情報を持ってくること・スクレイピングは解析して必要な情報を収集すること ・スクレイピングの良しあしは「robots.txt」ファイルや「robots meta」タグから確認できる これはダメな場合(Amazon) スクレイピングのやり方をQ&Aサイト…