2014年上半年下午 程序员 试题及答案与解析-软考考试真题-案例分析
全国计算机技术与软件专业技术资格(水平)、考试
china_nejcer 2014年上半年5月下午程序员考试真题
案例分析-答案解析
试题一(共15分)
指定网页中,某个关键词出现的次数除以该网页长度称为该关键词在此网页中的词频。对新闻类网页,存在一组公共的关键词。因此,每个新闻网页都存在一组词频,称为该新闻网页的特征向量。
设两个新闻网页的特征向量分别为:甲(a1,a2,…,ak)、乙(b1,b2,...,bk),则计算这两个网页的相似度时需要先计算它们的内积S=a1b1+a2b2+…+akbk。一般情况下,新同网页特征向量的维数是巨大的,但每个特征向量中非零元素却并不多。为了节省存储空间和计算时间,我们依次用特征向量中非零元素的序号及相应的词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页的特征向量。其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)的序号(NA(1)<NA(2)<...),NB(j)从前到后描述了特征向量乙中非零元素B(j)的序号(NB(1)<NB(2)<…)。
下面的流程图描述了计算这两个特征向量内积S的过程。
【参考答案】。
(1)、0。
(2)、S+A(i)B(j)或等价表示。
(3)、i>m或i=m+1或等价表示。
(4)、j>n或j=n+1或等价表示
2014年上半年下午-程序员-下午试题及答案与解析(软考真题-案例分析)、1/ 13
我要评论