Python 実践データ加工/可視化 100本ノック
著:下山 輝昌
著:伊藤 淳二
著:露木 宏志
内容紹介
機械学習やディープラーニング、データ分析などのスキルが求められるビジネスの現場が急増しています。一方で、入門書で得た知識を実際の現場でどうやって活かしていけばいいのか悩んでいる方も多くいます。本書は、Python実践データ分析100本ノックシリーズの第3弾として、様々なデータを扱う上で必須となるデータの加工・可視化から機械学習の前処理まで、実際のビジネスの現場で必要とされるノウハウが身につく実践問題集です。
目次
第1部 構造化データ
第1章 システムデータの加工・可視化を行う20本ノック
ノック1: 法人情報データを読み込んでみよう
ノック2: 読み込んだデータを確認しよう
ノック3: ヘッダ用のテキストファイルを読み込もう
ノック4: ヘッダ行を追加しよう
ノック5: 統計量や欠損値を確認しよう
ノック6: 繰り返し処理で新しいデータを追加しよう
ノック7: マスタを読み込んで項目を横に繋げよう
ノック8: テキストの連結や分割をしよう
ノック9: 日付を加工しよう
ノック10: 年度を設定しよう
ノック11: 加工したデータをファイルに出力しよう
ノック12: 不要な項目の削除と並べ替えをしよう
ノック13: まとまった単位で集計しよう
ノック14: 市区町村別の法人数を可視化しよう
ノック15: グラフの縦横と表示順を変えてみよう
ノック16: グラフのタイトルとラベルを設定しよう
ノック17: グラフの見た目をもっと変えてみよう
ノック18: 90日以内に新規登録された法人数を可視化しよう
ノック19: 年度別の推移を可視化しよう
ノック20: グラフとデータを出力しよう
第2章 Excelデータの加工・可視化を行う20本ノック
ノック21: Excelデータを読み込んでみよう
ノック22: カラムを抽出して付与してみよう
ノック23: 全シートのデータを読み込んでみよう
ノック24: データの値を計算で修正しよう
ノック25: 必要なカラムだけに絞り込もう
ノック26: 縦持ちデータを作成しよう
ノック27: 縦持ちデータを整形しよう
ノック28: 発電実績データを加工しよう
ノック29: 可視化用データを仕上げよう
ノック30: データの分布をヒストグラムで可視化してみよう
ノック31: データの分布を箱ひげ図で可視化してみよう
ノック32: 最近の発電量を可視化してみよう
ノック33: 先月の発電量とあわせて可視化してみよう
ノック34: 電力の時系列変化を可視化してみよう
ノック35: 電力の割合を可視化してみよう
ノック36: 電力量の多い都道府県を比較してみよう
ノック37: 都道府県、年月別の電力量を可視化してみよう
ノック38: 変数の関係性を可視化してみよう
ノック39: データを整形してExcel形式で出力しよう
ノック40: シート別にExcelデータを出力しよう
第3章 時系列データの加工・可視化を行う10本ノック
ノック41: 時系列データを読み込んでみよう
ノック42: 日付の範囲を確認しよう
ノック43: 日毎のデータ件数を確認しよう
ノック44: 日付から曜日を算出しよう
ノック45: 特定範囲のデータに絞り込もう
ノック46: 秒単位のデータを作成しよう
ノック47: 秒単位のデータを整形しよう
ノック48: 秒間の欠損データを処理しよう
ノック49: 通った人数を可視化しよう
ノック50: 移動平均を計算して可視化しよう
第2部 非構造化データ
第4章 言語データの加工・可視化を行う10本ノック
ノック51: テキストファイルを読み込もう
ノック52: 本文を抽出して1つに纏めよう
ノック53: 本文以外の項目を取り出そう
ノック54: 形態素解析で単語に分割しよう
ノック55: 分割した単語をデータフレームで保持しよう
ノック56: 名詞と動詞を取り出そう
ノック57: 不要な単語を除外しよう
ノック58: 単語の使用状況をグラフで可視化しよう
ノック59: Word Cloudで可視化してみよう
ノック60: n-gramを作ってみよう
まとめ
第5章 画像データの加工・可視化を行う10本ノック
ノック61: 画像ファイルを読み込んで表示してみよう
ノック62: 画像データの中身を確認しよう
ノック63: 画像データを切り出してみよう
ノック64: カラーヒストグラムを可視化してみよう
ノック65: RGB変換を行って画像を表示してみよう
ノック66: 画像のサイズを変更してみよう
ノック67: 画像を回転させてみよう
ノック68: 画像処理をしてみよう
ノック69: 画像にテキストや線を描画してみよう
ノック70: 画像を保存してみよう
第6章 音データの加工・可視化を行う10本ノック
ノック71: 音データを再生してみよう
ノック72: 音データを読み込んでみよう
ノック73: 音データの一部を取得してみよう
ノック74: 音データのサンプリングレートを変えてみよう
ノック75: 音データを可視化してみよう
ノック76: 音データの大きさを取得してみよう
ノック77: 周波数スペクトルを表示してみよう
ノック78: スペクトログラムを可視化してみよう
ノック79: 音の高さや長さを変えてみよう
ノック80: 音データを保存しよう
第3部 機械学習向けの加工と特殊なデータ加工
第7章 機械学習の前処理を行う10本ノック
ノック81: 機械学習で予測するデータを設定しよう
ノック82: TrainデータとTestデータに分割しよう
ノック83: データを機械学習に適した形式へ変換しよう
ノック84: 外れ値の検出をしよう
ノック85: データの分布をみてスケーリング手法を考えよう
ノック86: 分布に従ってスケーリングをやってみよう
ノック87: スケーラーを保存しよう
ノック88: 欠損値の処理をやってみよう
ノック89: 学習時のサンプル比率を調整しよう
ノック90: Testデータの前処理をしよう
第8章 特殊な加工・可視化を行う10本ノック
ノック91: 大容量CSVデータを扱ってみよう
ノック92: Json形式のファイルを扱ってみよう
ノック93: Webからデータを取得してみよう
ノック94: configファイルを扱ってみよう
ノック95: 動画ファイルを音声ファイルへ変換してみよう
ノック96: 動画ファイルを画像ファイルへ分割してみよう
ノック97: PowerPointやWordファイルを読み込んでみよう
ノック98: PDFデータを読み込んでみよう
ノック99: インタラクティブなグラフを作成してみよう
ノック100: 3次元グラフを作成してみよう
ISBN:9784798064390
。出版社:秀和システム
。判型:A5
。ページ数:368ページ
。定価:2400円(本体)
。発行年月日:2021年07月
。発売日:2021年08月02日
。国際分類コード【Thema(シーマ)】 1:KN。