シラバス参照

科目 ※英語学特殊研究IIa 
開講科目群 言語 
履修 選択 
年次 M1・2 
単位
開講科目ID GSL51810 
開講期・曜日・時限 前期 金曜日 2時限
教職課程との対応  
教員氏名

鈴木 卓(スズキ タカシ)

備考  



授業テーマ
Course
Theme
日本語と英語を対象としたテキストマイニング入門 
授業概要
Course
Outline
コンピュータを用いて談話・テキストを探索する「テキストマイニング」における様々な分析法を学び、実際に基礎的な分析を行う。日本語と英語それぞれの言語の分析法を学び、両言語ともに分析できるようにする。具体的には、語句の出現頻度とワードクラウド作成、Nグラムと相関、センチメント(意見・感情)分析を主に扱い、履修者の必要性と希望に応じてクラスター分析とトピックモデリングを含める。また分析ツールとしてフリーソフトの「R(アール)」を用いるため、テキストマイニングに必要な範囲で、初歩的なコーディングやデータ操作およびウェブからのデータ取得方法についても学ぶ。 
学生が授業内で
PCを使用する科目
yes 
実務経験のある
教員による科目
no 
実務経験との関連
(経験ありの場合のみ)
英語で授業を行う科目
Whether this class will be
conducted all in English (yes/no)
no 
課題解決型学習を取り入れている科目
Problem-solving learning method
is used in class (yes/no)
yes 
討議(ディスカッション、ディベート)を取り入れている科目
There are discussions/debates
in class (yes/no)
no 
グループワークを取り入れている科目
There are group works in class
(yes/no)
no 
発表(プレゼンテーション)を取り入れている科目
There are presentations in class
(yes/no)
yes 
フィールドワーク、実習、実験、実技を取り入れている科目
There are
fieldworks/training/experiments/
practices in class (yes/no)
yes 
到達目標
Aim/goal
学年終了時の到達目標は次の通り(履修前は以下の意味がわからなくてもかまわない)
・Rを用いていろいろなタイプのデータを扱い、また初歩的なコーディングをおこなうことができる
・R MeCabを用いて日本語テキストの形態素分析ができる
・日英両言語をデータとして(以下同様)、文章や談話中の単語の出現頻度の算出とワードクラウド作成ができる
・Nグラム・バイグラムの分析と可視化ができ、単語間の相関が調べられる
・センチメント辞書を使ったセンチメント(意見・感情)分析ができる
・以上の各技法を応用して、自分の選んだトピックについて簡単なリサーチをおこない、その結果について考察・発表ができる 
授業計画
Course Plan
第1回 (履修者の専攻言語等により授業計画を変更することがあるので、初回授業に出席できない場合はあらかじめ担当教員にメール等で連絡すること)
テキストマイニングとは
テキストマイニングを用いた研究例
RとR Studioの導入〜四則演算・ベクトル
MeCabの導入〜形態素分析 
第2回 教科書 第3章「R Studio速習」(データ形式・データ操作・主な関数) 
第3回 教科書 第3章「R Studio速習」実践演習 
第4回 教科書 第3章 まとめと復習 
第5回 教科書 第4章「文字処理と正規表現」(stringrパッケージ・tmパッケージ・単語文書行列) 
第6回 教科書 第4章「文字処理と正規表現」実践演習 
第7回 教科書 第4章 まとめと復習 
第8回 教科書 第5章「R MeCabによるテキスト解析」(頻度表・TDM・Nグラム) 
第9回 教科書 第5章「R MeCabによるテキスト解析」実践演習 
第10回 教科書 第5章 まとめと復習 
第11回 教科書 第6章「口コミのテキストマイニング」(ウェブスクレイピング・ネットワークグラフ) 
第12回 教科書 第6章「口コミのテキストマイニング」実践演習 
第13回 教科書 第6章 まとめと復習 
授業以外の学修
What Students
are expected
to do
outside of the class
教科書の範囲を予習し、自分でコードを入力したり実行したりして、わからない部分を明確にする。一つの分析法を一通り学んだら、自分の選んだテキストにその分析法を用いてみる。 
評価方法
Evaluation
毎回の授業における授業内課題・次回までの課題
自分で選んだトピックに基づく課題 
課題(試験やレポート等)に対する
フィードバックの方法
Feedback methods on assignments
授業内でコメントする 
履修前提要件
Prerequisites
テキストマイニングについて予備知識はまったく必要ありません。ただし言語の分析に最低限必要な初歩のコーディング(プログラミング)と統計の概念についても学ぶので、あらかじめ心得ておいてください。 
関連する
ディプロマポリシー
使用テキスト
Textbook
to be used,
if any
番号 著者
Author
書名
Title
出版社
Publisher
ISBN 定価
Price
備考
Remarks
1. 石田基広  『Rによるテキストマイニング入門(第2版)』  森北出版株式会社  978-4-627-84842-9  2600   
2. 小林雄一郎  『Rによる英文テキスト解析』  東洋大学社会学部    無料  販売なし(オンライン教材) 
必ず読まなければならない本や文献(購入する必要はないが、図書館等で参照を要するテキスト)Required books or materials (No purchase necessary, but students need to refer to them at places like libraries.)
読むことを推奨する本や文献(購入する必要はないが、図書館等で参照を要するテキスト)Recommended books or materials, if any. (No purchase nesessary, but students need to refer to them at places like libraries.)
番号 著者
Author
書名
Title
出版社
Publisher
ISBN 定価
Price
備考
Remarks
1. Garrett Grolemund著(大橋真也監訳)  『R StudioではじめるRプログラミング入門』  オライリー・ジャパン  978-4-87311-715-7  2860円  電子書籍2288円 
2. 石田基広他  『Rによるスクレイピング入門』  シーアンドアール研究所  978-4863542167  3542円  電子書籍3188円 
3. Julia Silge他著(大橋真也監訳)  『Rによるテキストマイニング』  オライリー・ジャパン  978-4-87311-830-7  3300円  電子書籍2640円 
テキストに
関する
連絡事項
Remarks
concerning
the text book,
if any
小林雄一郎(2015)「Rによる英文テキスト解析」は『東洋大学社会学部紀要 53巻』収載の論文です。以下のリンクから無料でダウンロードできます。
http://id.nii.ac.jp/1060/00008219/ 
更新日付 2025-01-08 20:17:23.65


PAGE TOP