ビッグデータアナリティクス (130042) Big Data Analytics (130042)
 
◇ 担当教員 Instructor : 中村 哲(Satoshi Nakamura / なかむら さとし)、 鈴木 優(Yu Suzuki / すずき ゆう)、
吉野 幸一郎(Koichiro Yoshino / よしの こういちろう)、 田中 宏季(Hiroki Tanaka / たなか ひろき)、
岩爪 道昭(Michiaki Iwazume / いわづめ みちあき)、 高橋 哲朗(Tetsuro Takahashi / たかはし てつろう)、
石川 信行(Nobuyuki Ishikawa / いしかわ のぶゆき)、 西村 隆宏(Takahiro Nishimura / にしむら たかひろ)
◇ 単位数 Credits : 1単位 ◇ 選択・必修 Required/Elective : 選択 ◇ 講義室 Room : L3
◇ 講義スタイル Style : 講義/公開
◇ 開講時期 Quarter : Ⅲ期 金曜3限

◇ 授業目的 Course goals : コンピュータの小型化,高速化,ネットワークの高速化により,テキストからセンサーデータに至る多様で膨大なビッグデータが出現した.このデータから有用な知識を抽出することは工学的,社会学的に重要な意味を持つ.本授業では,多様なビッグデータの取り扱いに関するデータサイエンスの理論,最先端の方法論を,実際のビッグデータを使った演習より学ぶ.
Bigdata is one of the hottest topics in the area of information science. A variety of information; texts, sensor data, social network services and lifelogs became available through the development of computers and networks. To extract new insights from those large and complex data sets is sociologically as well as technologically important. In this course, we will learn theory of data science and the state-of-the-art methodologies to handle various data by analyzing actual bigdata.
◇ 授業内容 Course description : 本授業では多様なビッグデータの取り扱いに関するデータサイエンスの理論,最先端の方法論を学び,インターネットのフォーラムにおけるテキストメッセージデータ,人と人の関連性データなどのビッグデータを使った演習を通して講述する.

1.ビッグデータ解析概論(中村 / 田中)
Introduction to bigdata analysis (Nakamura / Tanaka)

2.クローリング / ランキング(NICT,岩爪)
Crawling / ranking (Iwazume, NICT)

3.Apache Sparkによる分散計算(鈴木)
Bigdata analytics using Apache Spark (Suzuki)

4.ビッグデータのための機械学習(吉野)
Machine learning for bigdata (Yoshino)

5.リクルート式 データ利活用の実際(リクルートテクノロジーズ,石川/西村)
Utilization of big data ~In case of Recruit (Ishikawa, Recruit Technologies)

6.ソーシャルメディアアナリティクス(富士通研 高橋)
Social media analytics (Fujitsu Lab.)

7.課題発表会(鈴木 / 吉野)
Presentations (Suzuki / Yoshino)

8.リクルート式 データ利活用/課題発表会(リクルートテクノロジーズ,石川/西村)
Presentations (Ishikawa, Recruit Technologies)


◇ 教科書 Textbook : なし
None
◇ 参考書 Reference materials :
◇ 履修条件 Prerequisites : パターン認識(II期), 系列データモデリング(III期)を受講していることが望ましい
Students are assumed to have taken and understood the following subjects: Pattern Recognition (2nd quarter) and Sequential Data Modeling (3rd quarter).
◇ 成績評価 Grading : 小テスト,レポート、プレゼンテーションにより採点する
Mini-exams, Reports and Presentations at classes.
◇ オフィスアワー Office Hours : 電子メールにより中村までコンタクトしてください.
Contact Prof. Nakamura by email. (s-nakamura@is.naist.jp)
◇ 講義関連URL URL :
ビッグデータ講義関連資料(URL)
◇ 配布資料 Handouts : 現在、配布資料はありません。