裸で独りぼっち

マジの日記

Python

Kaggleへの道【1】タイタニックコンペ-②

とりあえず本を20pくらいまで読んだ。 データセットは3つ。 ダウンロードした。 テストデータとトレーニングデータ。 テストデータをもとに予想するということだ。 データは軽いので出先でもできるのがうれしいところ。 過学習とは何かについて調べるべきか…

Kaggleへの道【1】タイタニックコンペ-①

ちょっとはプログラミングもやっとこうという意思の元、kaggleに挑戦するゾ。 参考: https://note.com/currypurin (勉強用の個人誌を買った) Kaggleとは …データ分析・機械学習コンペ。世界最大。データ分析の天下一武道会。 俺の目標 …一応参加してて大会…

Pyhton2年生勉強第二章_HTMLの解析

・Beautiful soupでHTMLタグから必要な要素データを取り出せる。 米Beautifulsoupの由来は不思議の国のアリスに出てくる詩 ごちゃごちゃのHTMLスープからおいしい要素を見つけ出す 【1】BeautifulSoupとrequestsを組み合わせて解析を行う。 load_url html.pa…

Pyhton2年生勉強第一章_スクレイピングの基礎(テキストの取得)

前提 ・クローリングは情報を持ってくること・スクレイピングは解析して必要な情報を収集すること ・スクレイピングの良しあしは「robots.txt」ファイルや「robots meta」タグから確認できる これはダメな場合(Amazon) スクレイピングのやり方をQ&Aサイト…