Python
とりあえず本を20pくらいまで読んだ。 データセットは3つ。 ダウンロードした。 テストデータとトレーニングデータ。 テストデータをもとに予想するということだ。 データは軽いので出先でもできるのがうれしいところ。 過学習とは何かについて調べるべきか…
ちょっとはプログラミングもやっとこうという意思の元、kaggleに挑戦するゾ。 参考: https://note.com/currypurin (勉強用の個人誌を買った) Kaggleとは …データ分析・機械学習コンペ。世界最大。データ分析の天下一武道会。 俺の目標 …一応参加してて大会…
・Beautiful soupでHTMLタグから必要な要素データを取り出せる。 米Beautifulsoupの由来は不思議の国のアリスに出てくる詩 ごちゃごちゃのHTMLスープからおいしい要素を見つけ出す 【1】BeautifulSoupとrequestsを組み合わせて解析を行う。 load_url html.pa…
前提 ・クローリングは情報を持ってくること・スクレイピングは解析して必要な情報を収集すること ・スクレイピングの良しあしは「robots.txt」ファイルや「robots meta」タグから確認できる これはダメな場合(Amazon) スクレイピングのやり方をQ&Aサイト…