您所在的位置: 首页> 找技术> 专利技术> 正文
专利简介
本发明涉及一种融合标签平均划分距离和结构关系的社区可重叠划分方法,该方法包括以下步骤:⑴微博数据抓取;⑵核心标签划分:①对标签进行扩充;②定义标签区分度TDi,并获取TDi较大的top‑l个标签作为核心标签并用作后续步骤的社区划分;⑶基于平均划分距离的准社区划分;⑷计算准社区结构相异度:a求基于关注关系和节点度的结构相似度;b求结构相异度;c计算准社区结构相异度;⑸社区综合划分:A计算综合划分相异度;B求社区重叠度;⑹执行迭代算法。本发明综合考虑平均划分距离与结构相异度之间的关系,给定参数进行调节,得到综合划分相异度,选取综合划分相异度最小的标签划分形成的簇作为当前社区划分的结果并输出,使得划分合理准确。
我要收藏
温馨提示
此专利适用于积分落户、高企申报、中考加分、自主招生申报、获得大学学分。