学海网 文档下载 文档下载导航
设为首页 | 加入收藏
搜索 请输入内容:  
 导航当前位置: 文档下载 > 所有分类 > 2014年上半年下午 程序员 试题及答案与解析-软考考试真题-案例分析

2014年上半年下午 程序员 试题及答案与解析-软考考试真题-案例分析

2014年上半年下午 程序员 试题及答案与解析-软考考试真题-案例分析

全国计算机技术与软件专业技术资格(水平)、考试

china_nejcer 2014年上半年5月下午程序员考试真题

案例分析-答案解析

试题一(共15分)

指定网页中,某个关键词出现的次数除以该网页长度称为该关键词在此网页中的词频。对新闻类网页,存在一组公共的关键词。因此,每个新闻网页都存在一组词频,称为该新闻网页的特征向量。

设两个新闻网页的特征向量分别为:甲(a1,a2,…,ak)、乙(b1,b2,...,bk),则计算这两个网页的相似度时需要先计算它们的内积S=a1b1+a2b2+…+akbk。一般情况下,新同网页特征向量的维数是巨大的,但每个特征向量中非零元素却并不多。为了节省存储空间和计算时间,我们依次用特征向量中非零元素的序号及相应的词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页的特征向量。其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)的序号(NA(1)<NA(2)<...),NB(j)从前到后描述了特征向量乙中非零元素B(j)的序号(NB(1)<NB(2)<…)。

下面的流程图描述了计算这两个特征向量内积S的过程。

2014年上半年下午 程序员 试题及答案与解析-软考考试真题-案例分析

【参考答案】。

(1)、0。

(2)、S+A(i)B(j)或等价表示。

(3)、i>m或i=m+1或等价表示。

(4)、j>n或j=n+1或等价表示

2014年上半年下午-程序员-下午试题及答案与解析(软考真题-案例分析)、1/ 13

第1页

TOP相关主题

我要评论

相关文档

    站点地图 | 文档上传 | 侵权投诉 | 手机版
    新浪认证  诚信网站  绿色网站  可信网站   非经营性网站备案
    本站所有资源均来自互联网,本站只负责收集和整理,均不承担任何法律责任,如有侵权等其它行为请联系我们.
    文档下载 Copyright 2013 doc.xuehai.net All Rights Reserved.  email
    返回顶部