Friso(高性能中文分词器) V1.6.4 免费版
Friso是是基于C语言开放的一款免费开源的强大性能的中文分词器,主要靠mmseg算法来实现,支持中英/英中混合词的识别,支持阿拉伯数字/小数基本单字单位的识别,还可以自定义保留标点符号,安全的应用于多进程/多线程环境。
功能介绍
核心功能
中文分词:mmseg算法 + Friso 独创的优化算法,四种切分模式。
关键字提取:基于textRank算法。
关键短语提取:基于textRank算法。
关键句子提取:基于textRank算法。
中文分词
四种切分模式:
简易模式:FMM 算法,适合速度要求场合。
复杂模式: MMSEG 四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。
检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.6.1版本开始)。
最多模式:细粒度切分,专为检索而生,除了中文处理外(不具备中文的人名,数字识别等智能功能)其他与复杂模式一致(英文,组合词等)。
1、分词功能特性:
同时支持对 UTF-8/GBK 编码的切分,支持 php5 和 php7 扩展和 sphinx token 插件。
支持自定义词库。在 dict 文件夹下,可以随便添加/删除/更改词库和词库词条,并且对词库进行了分类。
简体/繁体/简体混合支持, 可以方便的针对简体,繁体或者简繁体切分。同时还可以以此实现简繁体的相互检索。
支持中英/英中混合词的识别(维护词库可以识别任何一种组合)。例如:卡拉ok, 漂亮mm, c语言,IC卡,哆啦a梦。
很好的英文支持,英文标点组合词识别, 例如c++, c#, 电子邮件,网址,小数,百分数。
2、自定义保留标点:你可以自定义保留在切分结果中的标点,这样可以识别出一些复杂的组合,例如:c++, k&r,code.google.com。
复杂英文切分的二次切分:默认 Friso 会保留数字和字母的原组合,开启此功能,可以进行二次切分提高检索的命中率。例如:qq2013会被切分成:qq/ 2013/ qq2013。
支持阿拉伯数字/小数基本单字单位的识别,例如2012年,1.75米,5吨,120斤,38.6℃。
自动英文圆角/半角,大写/小写转换。
3、同义词匹配:自动中文/英文同义词追加。 (需要在 friso.ini 中开启 friso.add_syn 选项)。
自动中英文停止词过滤。(需要在 friso.ini 中开启 friso.clr_stw 选项)。
多配置支持, 安全的应用于多进程/多线程环境。
下载地址
热门软件
Quick Collage Pro(照片拼接软件) V3.4.0 Mac版
Steam V20.10.91.91 官方版
百度网盘 V7.4.1.3 官方正式版
抖音采集工具 V2021 绿色版
2345看图王 V10.5.0.9364 官方正式版
小颖歌词制作器 V1.0 绿色版
Capture One21 V14.1.1 最新版
山丽防水墙单机版 官方版 V5.0
蓝山office V2021 最新版
Easy Video Reverser(视频倒放处理软件) V3.9.5 英文安装版
装机必备 更多+
应用软件下载排行榜
Goodbye Greenscreen(AI智能背景抠像颜色键控AE插件) V1.0.1 官方版
2蓝山office V2021 最新版
3Custom Cursor(鼠标光标美化插件) V2.1.9 免费版
4Adobe Premiere Pro CC 2019 V13.1.5.47 免安装版
5QQ浏览器 V10.8.4552.400 官方版
6秒书 V4.1.6 官方安装版
7Microsoft Mathematics(微软数学软件) V4.71.1015.0 中文版
8Microsoft office 2016 专业增强版
9Quickchm(CHM编排软件) V7.7.7 绿色免费版
10Ckeditor5 V11.4 免费版
电脑软件专题 更多+