一种基于概念相似度的数据分类方法

彭京 已出版文章查询
彭京
本平台内已出版文章查询
pj@pku.edu.cn
1 唐常杰 已出版文章查询
唐常杰
本平台内已出版文章查询
2 元昌安 已出版文章查询
元昌安
本平台内已出版文章查询
2 李川 已出版文章查询
李川
本平台内已出版文章查询
2 胡建军 已出版文章查询
胡建军
本平台内已出版文章查询
2

+ 作者地址

1四川大学,计算机学院,四川,成都,610065;成都市公安局,科技处,四川,成都,610017

2四川大学,计算机学院,四川,成都,610065


0
  • 摘要
  • 参考文献
  • 相关文章
  • 统计
依据数据属性间的相似信息,提出了一种分类方法.该方法将属性矢量化,属性作为m维空间的基本矢量,数据记录作为属性矢量的和.利用属性间先验的概念相似信息,给出了求取任意属性矢量对的相似距离算法,并将数据间相关度计算转换为属性矢量及其相互投影的公式,从而得到任意两条数据的相关度;利用相关度,提出了一种分类算法.用详实的实验证明了该算法的有效性.

[1] Indyk P;Motwani R.Approximate nearest neighbors:Towards removing the curse of dimensionality[A].New York:Acm Press,1998:604-613.

[2] Kleinberg J.Two algorithms for nearest-neighbor search in high dimensions[A].New York:Acm Press,1997:599-608.

[3] Kushilevitz E.;Rabani Y.;Ostrovsky R. .Efficient search for approximate nearest neighbor in high dimensional spaces[J].SIAM Journal on Computing,2000(2):457-474.

[4] Aggarwal C.Hierarchical subspace sampling:A unified framework for high dimensional data reduction,selectivity estimation,and nearest neighbor search[A].New York:Acm Press,2002:452-463.

[5] Berchtold S;Keim D;Kriegel HP.The X-tree:An index structure for high dimensional data[A].San Francisco:ACM Press,1996:28-39.

[6] Beyer K;Goldstein J;Ramakrishnan R;Shaft U.When is nearest neighbors meaningful?[A].Jerusalem:Springer-Verlag,1999:217-235.

[7] Gionis A;Indyk P;Motwani R.Similarity search in high dimensions via hashing[A].San Francisco:ACM Press,1999:518-529.

[8] Goldstein J;Ramakrishnan R.Contrast plots and P-sphere trees:Space vs.time in nearest neighbour searches[A].San Francisco:ACM Press,2000:429-440.

[9] White D;Jain R.Similarity indexing with the SS-tree[A].New Orleans:IEEE Computer Society,1996:516-523.

[10] Dwork C;Kumar R;Naor M;Sivakumar D.Rank aggregation methods for the web[A].New York:Acm Press,2001:613-622.

[11] Pettie S;Ramachandran V .A shortest path algorithm for real-weighted undirected graphs[J].SIAM Journal on Computing,2005(6):1398-1431.

[12] Yijie Han .Improved algorithm for all pairs shortest paths[J].Information processing letters,2004(5):245-250.

[13] Pettie S;Ramachandran V;Sridhar S.Experimental evaluation of a new shortest path algorithm[A].London:Springer-verlag,2002:126-142.

[14] 彭京,唐常杰,曾涛,乔少杰,雍小嘉.基于神经网络和属性距离矩阵的中药方剂功效归约算法[J].四川大学学报(工程科学版),2006(01):92-97.

[15] 彭京,唐常杰,曾涛,乔少杰,雍小嘉.基于神经网络和属性距离矩阵的中药方剂功效归约算法[J].四川大学学报(工程科学版),2006(01):92-97.


语种: 中文   

基金国家自然科学基金(60473071)

关键词数据挖掘 概念相似度 相似距离 属性矢量 分类


期刊热词
  • + 更多
  • 字体大小