出版社を探す

I/O Books

「クローリング」と「スクレイピング」

著:李 天琦

紙版

内容紹介

 日常行なわれている仕事が、次々とAI化されています。
 「経験に基づく仕事」や「型にはまった単純作業」ほど、AIで代替しやすく、高精度で効率良く仕事をこなしてくれます。
「不動産投資」も、まさにこの単純作業です。
 不動産を購入するまでのプロセスは、①物件情報仕入れ→②価格予測→③買い付け→④交渉……という、4ステップを踏む必要がありますが、投資家は、この①~④をひたすら繰り返しているだけです。
 特に、この①と②は極めてシンプルで単純作業なため、「AI」のほうが「人間」よりもはるかに適しています。
 本書では、「AI」を活用した「不動産投資」を例に、Web技術である「クローリング」と「スクレイピング」プログラミングをやさしく解説します。
[クローリング]…ロボット型検索エンジンにおいて、Webページ上の情報を複製・保存すること。
[スクレイピング]…WebサイトのHTMLから情報を収集し、解析・加工などの処理を行なうこと。

目次

■AIによる不動産投資の自動化
・AIに代替される不動産投資プロセス
・不動産投資の仕組み
・AIを用いた価格査定
■スクレイピング技術
・「スクレイピング技術」でできること
■「Python」+「Selenium」を用いたChromeスクレイピング
・環境構築
・ブラウザのテスト
・不動産サイトの「スクレイピング」
■IPアドレスによる自動BAN
・「Proxyサーバ」の仕組み
・Proxyによる自動BAN回避
・「Proxyサーバ」の構築と利用
■形態素解析を用いた不動産ビッグデータの名寄せ
・不動産データの名寄せ
・文字列処理
■不動産情報における「GISデータ」の扱い
・「GISデータ」とは
・MySQLで「GISデータ」を扱う
■「lightGBM」を使った不動産価格予測
・なぜ「AI」で「価格予測」をするのか
・「不動産価格予測AI」の仕組み
・「不動産価格予測AI」の実装
■「RESAS-API」を使った「地域人口データ」の扱い
・「将来価値予測」と「機械学習の限界」
・「RESAS」(リーサス)とは
・RESAS API/「RESAS API」の登録
・PythonからRESAS-APIを利用
・Anti-CAPTCHA

著者略歴

著:李 天琦
1989年中国蘇州市生まれ。ピアニストの父に連れられ来日。東京工科大学を首席で卒業。
学生時代に不動産領域に興味をもち、AIを用いた独自の価格分析システムを開発。
Microsoft Japanインターンシップ、日本ベンチャーキャピタル 大学ハッカソン 2014 優勝。
Google Japanにて、深層強化学習を用いた自動運転技術について招待公演。
DeNA入社後、システム本部にてAI研究開発に従事。DeNAの支援を受けて独立。現在、(株)DEVEL 代表取締役CEO。

ISBN:9784777521708
出版社:工学社
判型:A5
ページ数:128ページ
定価:1900円(本体)
発行年月日:2021年10月
発売日:2021年10月26日
国際分類コード【Thema(シーマ)】 1:UB