データマイニング?機械学習
トピックモデル
潜在的トピックモデル(私のブックマーク)
…潜在的トピックモデルに関する概要とポインタ
統計数理研究所 H24年度公開講座 「確率的トピックモデル」サポートページ
確率的トピックモデル
(持橋 大地)
トピックモデルの応用:イントロダクション
(石黒 勝彦)…LDAのさまざまな拡張モデルに関する説明(DTM含む)
確率的潜在変数モデル最前線
(佐藤 一誠, DEIM 2012)
NLP Programming Tutorial 7 - トピックモデル -
(Graham Neubig)
David M. Blei: Topic modeling
…Bleiのトピックモデルに関するホームページ.各種チュートリアルとプログラムへのリンクあり
Probabilistic Topic Models
(David M. Blei, KDD 2011のチュートリアル)
Probabilistic Topic Models
(David M. Blei, ICML 2012のチュートリアル)
Probabilistic Topic Models
(David M. Blei, Machine Learning Summer School 2012のチュートリアル)
潜在トピックモデルに基づくデータマイニング
(岩田 具治, 2010)…原稿
潜在トピックモデルに基づくデータマイニング
(岩田 具治, 2010)…発表スライド
トピックモデル概論
(東京工業大学)
Latent Dirichlet Allocation入門
(坪坂 正志)…LDAの入門的資料.Malletの説明もあり.
Latent Dirichlet Allocation
(Blei et al.)…LDAの原論文
Dynamic Topic Model
(Blei et al.)…DTMの原論文
SIGKDD 2011 Conference — Day 1 (Graph Mining and David Blei/Topic Models)
(R-bloggers)
自然言語処理のためのGibbsサンプリング (村脇有吾)
Latent Dirichlet Allocation(LDA)を用いたニュース記事の分類
ノンパラメトリックベイズ言語モデルによるコーパス内トピック抽出 ーCLML-HDP-LDAパッケージを用いたコーパス分析例ー
(阿部裕介)
ノンパラベイズ入門の入門
(中谷秀洋?サイボウズ?ラボ)
LDA による文書集合のクラスタリング
(y_utiのブログ)…PLDAの実行について
パターン認識と機械学習 (Pattern Recognition and Machine Learning)
Pattern Recognition and Machine Learning
…原著のサポートページ
PRML
…日本語版のサポートページ
prml
…サイボウズラボの光成滋生きる氏によるPRML用の参考資料.
機械学習
機械学習の理論と実践
(岡野原 大輔, SACSIS 2013)
統計的機械学習入門
…東京大学中川研究室の資料.
統計科学のための電子図書システム
…統計科学に関する電子書籍アーカイブ
ディリクレ分布
…「パターン認識と機械学習」のディリクレ分布に関する紹介
Microsoft Azure Machine Learning Algorithm Cheat Sheet
…Microsoft Azureの機械学習アルゴリズムチャートに関する紹介.Dlib C++とscikit-learnのチャートに関するリンクもある.
Deep Learning
一般向けのDeep Learning
(岡野原 大輔)
Deep Learning 輪読会 2013
自然言語処理のためのDeep Learning
(菊池 悠太)
私のブックマーク Deep Learning
(中山 浩太郎)
Deep learning 用語集
Deep Learning and Neural Networks
(Kevin Duh)
Deep Learning Tutorials
データ分析
@IT: ITエンジニアのためのデータサイエンティスト養成講座(中林紀彦,日本アイ?ビー?エム)
ITエンジニアがデータサイエンティストを目指すには?
データ分析がデキるITエンジニアになるために必要な「道具」を揃える
データを取り込む?格納するための方法を理解する
ログを分析するには? XMLデータを分析するには? pandasでデータを分析できる状態にする
「ビールと紙おむつ」のような相関関係を探る分析手法にはどんなものがある?――データ分析方法についての検討
回帰分析I:回帰分析って何? から、最小二乗法、モデル評価、妥当性検討の実際まで
WEKA
Waikato大学で開発されたJava言語で書かれたデータマイニング?機械学習のプログラム.
Weka 3: Data Mining Software in Java
MALLET
Javaで実装されたデータマイニング?機械学習のプログラム.
MALLET(MAchine Learning for LanguagE Toolkit )
HDA入門
CRF++
CRF++: Yet Another CRF toolkit
GibbsLDA++
GibbsLDA++: A C/C++ Implementation of Latent Dirichlet Allocation
GibbsLDA++でトピック分析
word2vec
word2vec - Tool for computing continuous distributed representations of words.
Learning the meaning behind words
(Google Open Source Blog)
Distributed Representations of Words and Phrases and their Compositionality
(NIPS)
Neural Network Based Language Model
(内海 慶)
https://code.google.com/p/word2vec/ で少し遊んでみた。
(工藤 拓)
自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる
(あんちべ)
ニューラルネットによる単語のベクトル表現の学習 ? Twitterのデータでword2vecしてみた
(病みつきー)
風間 一洋