はじめに
演習で用いるファイルについて
第1章 言語研究とテキストデータ処理
1 本書のねらい
2 本書の構成
第2章 サーチエンジンによる英語表現の検索
1 サーチエンジンと用例検索
2 環境やツールなどによる違い
3 Googleによる用例検索
3.1 Googleのウェブ検索のクエリで使用できる構文
3.2 Googleのクエリを利用した用例検索
3.3 活用形を調べる:コンピューターのマウスmouseの複数形
3.4 名詞の数:0は単数か複数か
3.5 前置詞,形容詞,動詞,副詞の検索
3.5.1 前置詞の検索(1)
3.5.2 前置詞の検索(2):前置詞や動詞を加えて制限する
3.5.3 動詞の検索
3.5.4 形容詞の検索(1):限定用法
3.5.5 形容詞の検索(2):叙述用法
3.5.6 副詞の検索
4 サーチエンジン利用の際の注意点
第3章 正規表現によるテキストの検索
1 正規表現について
1.1 正規表現とは
1.2 正規表現を学ぶ意義
1.3 正規表現が使えるツールの例と正規表現の種類
2 練習用ページ,表記,バックスラッシュについて
3 正規表現の文法
3.1 リテラル,語の境界
3.2 論理和と範囲指定
3.3 任意の文字と文字クラス
3.4 量指定子(繰り返し)
3.5 量指定子の有効範囲
3.6 「任意の語」
3.7 「任意の語」の語数の指定
3.8 メタキャラクタのエスケープ
3.9 検索の単位と制御文字,位置
3.10 正規表現によるパターンの指定の例
4 正規表現による検索で注意すべきこと
第4章 テキストデータ処理のための基礎知識
1 はじめに
2 ファイル,ディレクトリ,ワイルドカード
2.1 ファイルの形式
2.1.1 ビットとバイト
2.1.2 テキストファイルとバイナリファイル
2.1.3 ファイルの形式と拡張子
2.2 ワイルドカード
2.3 ディレクトリ,フォルダ
2.4 圧縮・展開,アーカイブ
3 キー操作,マウス操作,ショートカットなど
3.1 モディファイアキー,ショートカット
3.2 タブ
3.3 マウス操作
3.4 ウィンドウの分割など
4 データと処理ツールの分離,ファイルの共有
4.1 アプリケーションを指定してファイルを開く
4.2 ファイル名
4.3 改行コード
4.4 論理行と表示行
5 文字コードについて
5.1 ビット列の表記法
5.1.1 ビット数と区別可能な状態の数
5.1.2 2進数と16進数
5.2 文字コード
5.2.1 符号化文字集合と文字符号化方式
5.2.2 バックスラッシュ(\)と円記号(¥)
5.2.3 半角文字と全角文字
5.2.4 漢字
5.3 ツールの文字コードと対象テキストの文字コード
第5章 テキストエディタによる検索と加工
1 テキストエディタの種類と機能
2 エディタによる検索・抽出
3 エディタによるテキストの加工
4 後方参照と文字列のマーキング
5 まとめ
第6章 表計算ソフトによるテキストデータ処理
1 はじめに
2 表計算ソフトによるテキストデータ処理
2.1 テキストファイルのデータの読み込みと保存
2.2 セルの書式(データの形式)
2.3 セルの選択,コピー,移動,削除,挿入,オートフィル
2.4 行の高さ,列の幅の変更,表示・非表示
2.5 オートフィルター:条件に合ったデータの取り出し
2.6 並べ替え
2.7 式,セルの参照,関数
2.8 関数の組み合わせ
2.9 ユーザー定義関数
2.10 単語の頻度表の作成
2.11 n-gramの頻度表の作成
付録 Wordのワイルドカードによる処理
演習問題解説
参照文献