授業テーマ Course Theme
|
|
|
|
授業概要 Course Outline
|
|
コンピュータを用いて談話・テキストを探索する「テキストマイニング」における様々な分析法を学び、実際に基礎的な分析を行う。日本語と英語それぞれの言語の分析法を学び、両言語ともに分析できるようにする。具体的には、語句の出現頻度とワードクラウド作成、Nグラムと相関、センチメント(意見・感情)分析を主に扱い、履修者の必要性と希望に応じてクラスター分析とトピックモデリングを含める。また分析ツールとしてフリーソフトの「R(アール)」を用いるため、テキストマイニングに必要な範囲で、初歩的なコーディングやデータ操作およびウェブからのデータ取得方法についても学ぶ。
|
|
|
学生が授業内で PCを使用する科目
|
|
|
|
実務経験のある 教員による科目
|
|
|
|
実務経験との関連 (経験ありの場合のみ)
|
|
|
|
英語で授業を行う科目 Whether this class will be conducted all in English (yes/no)
|
|
|
|
課題解決型学習を取り入れている科目 Problem-solving learning method is used in class (yes/no)
|
|
|
|
討議(ディスカッション、ディベート)を取り入れている科目 There are discussions/debates in class (yes/no)
|
|
|
|
グループワークを取り入れている科目 There are group works in class (yes/no)
|
|
|
|
発表(プレゼンテーション)を取り入れている科目 There are presentations in class (yes/no)
|
|
|
|
フィールドワーク、実習、実験、実技を取り入れている科目 There are fieldworks/training/experiments/ practices in class (yes/no)
|
|
|
|
到達目標 Aim/goal
|
|
学年終了時の到達目標は次の通り(履修前は以下の意味がわからなくてもかまわない) ・Rを用いていろいろなタイプのデータを扱い、また初歩的なコーディングをおこなうことができる ・R MeCabを用いて日本語テキストの形態素分析ができる ・日英両言語をデータとして(以下同様)、文章や談話中の単語の出現頻度の算出とワードクラウド作成ができる ・Nグラム・バイグラムの分析と可視化ができ、単語間の相関が調べられる ・センチメント辞書を使ったセンチメント(意見・感情)分析ができる ・以上の各技法を応用して、自分の選んだトピックについて簡単なリサーチをおこない、その結果について考察・発表ができる
|
|
|
授業計画 Course Plan
|
|
第1回
|
(履修者の専攻言語等により授業計画を変更することがあるので、初回授業に出席できない場合はあらかじめ担当教員にメール等で連絡すること) テキストマイニングとは テキストマイニングを用いた研究例 RとR Studioの導入〜四則演算・ベクトル MeCabの導入〜形態素分析
|
第2回
|
教科書 第3章「R Studio速習」(データ形式・データ操作・主な関数)
|
第3回
|
教科書 第3章「R Studio速習」実践演習
|
第4回
|
教科書 第3章 まとめと復習
|
第5回
|
教科書 第4章「文字処理と正規表現」(stringrパッケージ・tmパッケージ・単語文書行列)
|
第6回
|
教科書 第4章「文字処理と正規表現」実践演習
|
第7回
|
教科書 第4章 まとめと復習
|
第8回
|
教科書 第5章「R MeCabによるテキスト解析」(頻度表・TDM・Nグラム)
|
第9回
|
教科書 第5章「R MeCabによるテキスト解析」実践演習
|
第10回
|
教科書 第5章 まとめと復習
|
第11回
|
教科書 第6章「口コミのテキストマイニング」(ウェブスクレイピング・ネットワークグラフ)
|
第12回
|
教科書 第6章「口コミのテキストマイニング」実践演習
|
第13回
|
教科書 第6章 まとめと復習
|
|
|
授業以外の学修 What Students are expected to do outside of the class
|
|
教科書の範囲を予習し、自分でコードを入力したり実行したりして、わからない部分を明確にする。一つの分析法を一通り学んだら、自分の選んだテキストにその分析法を用いてみる。
|
|
|
評価方法 Evaluation
|
|
毎回の授業における授業内課題・次回までの課題 自分で選んだトピックに基づく課題
|
|
|
課題(試験やレポート等)に対する フィードバックの方法 Feedback methods on assignments
|
|
|
|
履修前提要件 Prerequisites
|
|
テキストマイニングについて予備知識はまったく必要ありません。ただし言語の分析に最低限必要な初歩のコーディング(プログラミング)と統計の概念についても学ぶので、あらかじめ心得ておいてください。
|
|
|
関連する ディプロマポリシー
|
|
|
|
使用テキスト Textbook to be used, if any
|
|
| |
番号
|
著者 Author
|
書名 Title
|
出版社 Publisher
|
ISBN
|
定価 Price
|
備考 Remarks
|
|
1.
|
石田基広
|
『Rによるテキストマイニング入門(第2版)』
|
森北出版株式会社
|
978-4-627-84842-9
|
2600
|
|
|
2.
|
小林雄一郎
|
『Rによる英文テキスト解析』
|
東洋大学社会学部
|
|
無料
|
販売なし(オンライン教材)
|
|
|
|
必ず読まなければならない本や文献(購入する必要はないが、図書館等で参照を要するテキスト)Required books or materials (No purchase necessary, but students need to refer to them at places like libraries.)
|
|
|
|
読むことを推奨する本や文献(購入する必要はないが、図書館等で参照を要するテキスト)Recommended books or materials, if any. (No purchase nesessary, but students need to refer to them at places like libraries.)
|
|
| |
番号
|
著者 Author
|
書名 Title
|
出版社 Publisher
|
ISBN
|
定価 Price
|
備考 Remarks
|
|
1.
|
Garrett Grolemund著(大橋真也監訳)
|
『R StudioではじめるRプログラミング入門』
|
オライリー・ジャパン
|
978-4-87311-715-7
|
2860円
|
電子書籍2288円
|
|
2.
|
石田基広他
|
『Rによるスクレイピング入門』
|
シーアンドアール研究所
|
978-4863542167
|
3542円
|
電子書籍3188円
|
|
3.
|
Julia Silge他著(大橋真也監訳)
|
『Rによるテキストマイニング』
|
オライリー・ジャパン
|
978-4-87311-830-7
|
3300円
|
電子書籍2640円
|
|
|
|
テキストに 関する 連絡事項 Remarks concerning the text book, if any
|
|
|
|
更新日付
|
|
2025-01-08 20:17:23.65
|