出版社を探す

ふりがなプログラミングシリーズ

スラスラ読める Pythonふりがなプログラミング スクレイピング入門

著:リブロワークス
著:株式会社ビープラウド

電子版

内容紹介

■□■プログラムが読めればデータ収集・効率化が自由自在!!■□■ 「プログラムの読み方をすべて載せる(ふりがなをふる)」という手法で究極のやさしさを目指した、まったく新しいプログラミングの解説書「ふりがなプログラミング」シリーズから、Pythonを使ったスクレイピングの入門書が登場しました。 スクレイピングを用いれば、Web上のサイトを定期的にチェックしたり、一覧になったURLのリンク先を順番に参照したりといった作業を、プログラムで自動化できるようになります。応用できる範囲は趣味から仕事まで実に幅広く、Pythonで行えることが一気に広がります。 本書では、サンプルのWebページや実際のWebページを題材にして、Webサイトの構造を把握することからしっかり解説。データの収集、データの整理・加工といった、一連の流れを学ぶことができます。 ■本書はこんな人におすすめ ・Pythonを使ったスクレイピングの基本を身につけたい人 ・過去に入門書で挫折してしまった人 ・プログラマーやエンジニアを目指す人 ・仕事でPythonを活用してみたい人

目次

表紙 著者プロフィール はじめに プログラムの読み方 Chapter 1 スクレイピング最初の一歩 01 スクレイピングって何? 02 本書の読み進め方 03 Pythonのインストール 04 Visual Studio Codeのインストール 05 スクレイピングに必要なライブラリのインストール 06 VS Codeでプログラムを作成してみよう Chapter 2 スクレイピングをやってみよう 01 HTMLを理解することがスクレイピングの第一歩 02 Webページから要素を取り出す 03 HTML属性を指定して要素を取り出す 04 Webページから要素を複数取り出す 05 パターンに一致した要素を取り出す 06 取り出した要素をさらに絞り込む 07 実際のWebページでスクレイピングする 08 要素を取り出せない場合は(1) 09 CSSセレクタってどんなもの? 10 CSSセレクタを使って要素を取り出す Chapter 3 スクレイピングの応用テクニック 01 Webページ内のリンクを取り出す 02 画像を取り出す 03 前後の要素を取り出す 04 ページ遷移しながらスクレイピングする 05 要素を取り出せない場合は(2) 06 エラーに強いプログラムを作成する Chapter 4 集めたデータを整理・加工しよう 01 集めたデータを使うには 02 全角・半角の表記ゆれをなくす 03 大文字・小文字の表記ゆれをなくす 04 文字列を置換する 05 表形式のデータを扱う 06 表形式のデータから列や行を取り出す 07 条件に一致したデータを取り出す 08 欠損値があるデータを加工する 09 表形式のデータを集計する 10 グラフでデータを可視化する Chapter 5 Web APIでデータを集めよう 01 Web APIを使ってみよう 02 その他のスクレイピングライブラリ あとがき 索引 本書サンプルプログラムのダウンロードについて 奥付

JP-eコード:2950117411000000000f
出版社:インプレス
コンテンツ公開日:2021年12月01日