エンジニア・クリエイター採用

エンジニア・クリエイター採用

ナイーブベイーズ分類器の開発

最近文章とキーワードを自動的にカテゴリーに分類するプログラムの開発をさせていただきました。

カテゴリーの自動分類はk近傍法(KNN)や決定木やロジスティック回帰などいくつかやり方がありますが、今回の要望に応じて、ナイーブベイーズにしました。

ナイーブベイーズはベイーズ定理の基で開発された分類の技術で根本はベイーズ定理の下記の式となります。

P(cat|document) = P(document|cat)*p(cat)/p(document)

基本の考え方はある文章documentが与えられた上、それぞれの既定のカテゴリーcatに当てはまる確率(事後確率)を計算し、一番確率が高いカテゴリーに分類すれば大丈夫です。

また、文章はそもそも単語の塊と考えられ、ある文章となる確率はそれぞれの単語が発生する確率の積だと考えられます。そうすると、式は下記となります。

P(cat|document)=p(word1|cat)*p(word2|cat)*...p(wordn|cat)*p(cat)/(p(word1)*p(word2)*p(word2)*...*p(wordn))

また、確率の桁数はかなり大きいので、logをとって、表示することにしました。

log(P(cat|document)) = Σ log(p(wordi|cat)) + log(p(cat)) - Σ log(p(wordi))

#MEDIA
VIEW MORE

Font Awesome 5 の重ねる機能がすごい件

ベクター画像で作成されたアイコン集で、閉じるボタンのような部品からFacebookやTwitterなどのSNSのアイコンまで揃っています。
Font Awesome 5からは下記のようにLINEのアイコンが収録されました。
https://fontawesome.com/icons/line?style=brands
以前はLINEだけ他のウェブフォントを採用する必要があったので、痒いところに手が届くバージョンアップだと感じています。
(画像出典:Font Awesome 5公式サイト)

#MEDIA
VIEW MORE

ブログ7

テキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキストテキスト

#MEDIA
VIEW MORE

ブログ4

#MEDIA
VIEW MORE