Affilication of Author(s):北京邮电大学
Teaching and Research Group:智能科学与技术中心
Patent Coverage:中国
School Sign:北京邮电大学
First Author:Lei Li
Disigner of the Invention:Yang Nie,Qing Zhao
Patent description:本发明公开了一种检测文本重复的方法:根据一文本中每一个词语的TF值及其是否在标题中出现得到该词语的权值,顺序从文本中取出权值最高的若干词语作为关键词集框架;对于得到关键词集框架的任意两篇文本,依次判断一篇文本关键词集框架中的每一个词语是否在另一篇文本的关键词集框架中,当该词语属于两篇文本的关键词集框架、且在两篇文本中的权值匹配时,将表征匹配程度的匹配值加1,直至一篇文本关键词集框架中最后一个词语,根据得到的匹配值得到两篇文本的相似度;根据相似度及一相似度阈值判断出两篇文本是否为重复的文本。
Type of Patent:Invent
State of Patent:Authorized patents
Application Number:201110029493.8
Authorization number:ZL 2011 1 0029493.8
Number of Inventors:3
Service Invention or Not:yes
Application Date:2011-01-27
Publication Date:2011-01-20
Authorization Date:2012-07-04
Professor
Supervisor of Doctorate Candidates
Supervisor of Master's Candidates
Gender:Female
Alma Mater:Beijing University of Posts and Telecommunications
Education Level:研究生毕业
Degree:博士学位
Status:在职
School/Department:School of Artificial Intelligence
Discipline:Computer science and technology *
Business Address:Room 812, Scientific-research Building
Contact Information:leili@bupt.edu.cn
ZipCode :
PostalAddress :
email :
Honors and Titles:
北京邮电大学2021年 “校友奖教金” 2021
钟义信、周延泉、李蕾、王小捷、袁彩霞、李睿凡、鲁鹏、董譞、杨亚,北京邮电大学2021年教学成果奖 一等奖 “开拓创新的智能科学与技术本科专业建设” 2021
指导赵鑫竹、胡鼎新、王宇卓、余子雨、张超伟、王俊博获第七届中国国际“互联网+”大学生创新创业大赛(北京赛区)二等奖 2021
钟义信、李蕾、王小捷、刘建毅、郭燕慧、王枞、周延泉、谭咏梅、李睿凡、左兴权,人工智能统一理论,中国电子学会电子信息科学技术奖三等奖 2009
数字内容技术试验平台,2010北京邮电大学教学成果奖1等奖,排名第6 2010
2011年首届“全国大学生智能设计竞赛”优秀指导教师奖(一等奖队伍指导教师) 2011
2012年第二届“华为杯全国大学生智能设计竞赛”一等奖队伍指导教师 2012
2016年第六届“华为杯全国大学生智能设计竞赛”一等奖队伍指导教师 2016
2018年获得中国产学研合作促进会设立的产学研合作创新与促进奖之:2018年产学研合作创新成果奖二等奖 2018
Opening Time:..
The Last Update Time:..