TokyoWebmining の勉強会初参加

本日とても内容の濃い議論が交わされた勉強会

インプットのあとはアウトプット

ということで

jaccard 係数 http://en.wikipedia.org/wiki/Jaccard_index

先人がすでにライブラリを公開していないか調べてみた。

haskell jaccard で検索すると・・・ありました。

http://hackage.haskell.org/packages/archive/nlp-scores/0.2.2/doc/html/NLP-Scores.html

NLP.ScoresのなかにJaccard coefficient J(A,B) = |AB| / |A union B|関数を発見

さっそく発見したライブラリを利用してちょっと遊んでみます。

前提
AさんとIさんの関係は、友達の友達

Aさんの友人は ['b','c','d','e']
Iさんの友人は ['b','c','d']
とすると・・いかに

module Jaccard where

import NLP.Scores
import Data.Set

a = fromAscList ['b','c','d','e']
i = fromAscList ['b','c','d']

main = do
jaccard a i