TAMALOG

プログラミングがあれば遠いところへ行けます。プログラムと人の共生を記録します。

2018-01-01から1年間の記事一覧

WACATE2日目の感想

WACATE 2018 夏に参加しています。WACATE最終日が終わったので2日目の感想を書きます。 tamanobi.hatenablog.com おいしいカレー 毎年恒例らしい。 #WACATE テスト設計ワーク終了ー。お昼はマホロバカレー! pic.twitter.com/gL3Spdn1z1— たまのび@日焼けす…

WACATE1日目の感想

WACATE 2018 夏に参加しています。今は二日間の一日目。 wacate.jp 目的 単体テストだけでなく、より上流のテストについて学ぶために参加しました。 おいしいまぐろ丼 概要 今回のテーマはモデリングです。UMLのユースケース図、アクティビティ図、状態遷移…

カテゴリカルデータに対するロジスティック回帰分析

どんな手法でも性質を知らずに、使うことは避けたほうが良い。 ロジスティック回帰分析を調べていると、説明変数が連続ではない場合(カテゴリカルデータ)について知りたくなった。 試しに擬似データで、一通り分析をしてみる。 性別と年齢層が説明変数、ク…

カイ二乗分布を描いてみる

カイ二乗分布を知っていたつもりだが、正規分布から簡単に生成できることを忘れていた。 カイ二乗分布は、独立に標準正規分布に従うk個の確率変数の二乗和が従う分布。 実際に、標準正規分布から10000個ずつ出して分布を出してみた。k = 10 くらいになると形…

Rを使って簡単な線形モデルを試す

以下に試したことをまとめた。R StudioのRmdを使うと便利にレポートが作れる。仕事でも活用したい。 線形モデル - Google ドキュメント 埋め込みも試してみる。

近況報告

ここ数ヶ月の近況 2年以上お世話になった先輩が退職。 1年近く一緒に仕事していた先輩が退職。 Courseraで機械学習を基本から学び始めた エンジニアが僕を含めてやっと3名になり、開発リーダーに近い立ち位置になった NEMの簡単な説明をする講師をやった 所…

二項分布について

70%の確率でアタリが出るくじを100回反復施行することを考える。 当然、100回のうち約70回はアタリを引くことができるはずだ。確率pでアタリのでるくじをN回反復試行したときのアタリの出る回数は二項分布に従うらしい。 実際にグラフを書いてみる。R Studio…

データ解析のための統計モデリングについて調べている

仕事でやりたいことができたので、こちらのサイトの資料を読み続けている。 講義のーと : データ解析のための統計モデリング : HUSCAP この講義資料は通称、緑本と呼ばれている本の前身です。

統計モデルについてよくまとまっている

http://hosho.ees.hokudai.ac.jp/~kubo/stat/2016/0318/a/kuboAS2016a.pdf 久保先生のスライドはよく作られていて、概略をつかみやすい。モデリングの肝は、応答変数の確率分布なのかも?

Coursera の Machine Learning Courseを始めて5週目

Coursera の Machine Learning Courseを4月2日からお金を払って始めました。すでに5週目に突入です。 なぜ始めたか? キャリアアップのために始めました。機械学習の基本的な知識が足りなくて不自由する機会が多くなってしまいました。 始めたきっかけ 始め…

二値分類器のAUC

機械学習で作成したモデルは、様々な計算方法で評価される。ここでは、ROC曲線とAUCについてまとめてみる。 二値分類器について考える。二値分類器は[0, 1]区間の実数値(以下、スコア)を出力するものとする。 データ番号 正解ラベル スコア 1 apple 0.1 2 no…

ビュールレ・コレクションを見に行った。

国立新美術館で、印象派の展覧会があったので行ってきた。ビュールレ・コレクションは近いうちにチューリヒ美術館に寄贈されるらしく、日本これだけの作品を見られるのはこの機会だけらしい。 僕は絵画が好きなだけなので、あまり歴史には詳しくない。美術館…

「お金2.0」を読んだ。

去年、「金持ち父さん、貧乏父さん」という本に触発されて依頼、お金への関心が強くなっている。「お金2.0」を読み終わったので、雑な要約を載せておく。 今日読み終えた「お金2.0」という本では、今300年の歴史がある貨幣経済にパラダイムシフトが起こって…

このブログを読んだが、声質変換の知識と多層ニューラルネットワークの知識が足りずに全体的にわからなかった。 hiroshiba.github.io 特にわからなかったのは以下。pix2pixが適しているのかよくわからない。 少ないデータ数で学習させるには、pix2pixモデル…