5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

【はてなブックマーク】SBMサービス【del.icio.us】

92 :友達の友達の名無しさん:2005/12/17(土) 13:31:02 ID:6Ef5DnN5
>>86
>>87
>>89
そういうのを形態素解析っていうんだけど、形態素解析の弱点は
辞書をメンテナンスしなきゃいけないところ。

なので、最近主流はN-gramインデックスだね。
GoogleとかYahooのロボット型検索もそう。

形態素解析は検索技術としてはそんなにすごいものではない。
どちらかというと、古くて、枯れている技術。

ただ、はてなのやつは使ってみたところ、like(grep)検索じゃね?
って思うぐらい遅い。もし、like検索だったりしたら、一番ヘボイかも。

joltは検索は早いけど、N-gramだからなのか、like(grep)検索なんだけれども、
データ数が少ないから速く動いているように見えるのかは不明。

検索技術としては、こんな感じかな。

N-gram > 形態素解析 > like(grep)検索


164 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)