计算机科学与探索杂志学术研究
751-760
多维数据特征融合的用户情绪识别
作者:陈茜; 史殿习; 杨若松 单位:国防科技大学计算机学院并行与分布处理国防科技重点实验室; 长沙410073
摘要:针对目前基于智能手机的情绪识别研究中所用数据较为单一,不能全面反应用户行为模式,进而不能真实反应用户情绪这一问题展开研究,基于智能手机从多个维度全面收集反应用户日常行为的细粒度感知数据,采用多维数据特征融合方法,利用支持向量机(support vector machine,SVM)、随机森林(random forest)等6种分类方法,基于离散情绪模型和环状情绪模型两种情绪分类模型,对12名志愿者的混合数据和个人数据分别进行情绪识别,并进行了对比实验。实验结果表明,该全面反应用户行为的多维数据特征融合方法能够很好地对用户的情绪进行识别,其中使用个人数据进行情绪识别的准确率最高可达到79.78%,而且环状情感模型分类结果明显优于离散分类模型。
761-772
基于LCA分块算法的大学科研人员信息抽取
作者:易晨辉; 刘梦赤; 胡婕 单位:武汉大学计算机学院; 武汉430072; 湖北大学计算机与信息工程学院; 武汉430062
摘要:现有的半结构化网页信息抽取方法主要假设有效数据间具有较强结构相似性,将网页分割为具有类似特征的数据记录与数据区域然后进行抽取。但是存有大学科研人员信息的网页大多是人工编写填入内容,结构特征并不严谨。针对这类网页的弱结构性,提出了一种基于最近公共祖先(lowest common ancestor, LCA)分块算法的人员信息抽取方法,将LCA和语义相关度强弱的联系引入网页分块中,并提出了基本语义块与有效语义块的概念。在将网页转换成文档对象模型(document object model,DOM)树并进行预处理后,首先通过向上寻找LCA节点的方法将页面划分为基本语义块,接着结合人员信息的特征将基本语义块合并为存有完整人员信息的有效语义块,最后根据有效语义块的对齐获取当前页面所有关系映射的人员信息。实验结果表明,该方法在大量真实的大学人员网页的分块与抽取中,与MDR(mining data records)算法相比仍能保持较高的准确率与召回率。
计算机科学与探索杂志数据库技术
773-785
社会网络中弱关系团队形成问题研究
作者:孙焕良; 富珊珊; 刘俊岭; 于戈; 许鸿斐 单位:沈阳建筑大学信息与控制工程学院; 沈阳110168; 东北大学信息科学与工程学院; 沈阳110006
摘要:随着在线社会网络的迅速发展,社会网络的团队形成问题逐渐成为研究热点。现有的社会网络中团队形成问题目标是寻找一个成员间沟通代价最小的团队。然而,实际应用中团队成员间的不紧密关系使得团队的观点多样化、多角度、无偏见,可以广泛应用于形成专家评审团队、大众评审团等。基于此需求,将社会学的弱关系概念引入团队形成问题中,提出了一种社会网络中弱关系团队形成问题。该问题旨在寻找成员间为弱关系,同时满足技能、经验值要求的一个团队,为NP-hard问题。提出了3类算法解决该问题,分别为贪心算法、精确算法、α-近似算法,每类算法有各自的特点与适用范围。利用ACM和DBLP两类真实的数据集进行实验,综合评估了各类算法的效率与求解质量,证明了提出算法的有效性。
786-798
异方差加噪下的差分隐私直方图算法
作者:康健; 吴英杰; 黄泗勇; 陈鸿; 孙岚 单位:福州大学数学与计算机科学学院; 福州350116
摘要:现有基于区间树结构的差分隐私直方图方法大多采用同方差加噪方式,对其进一步研究发现,采用异方差加噪策略可以进一步提升直方图的区间计数查询精度,然而当前基于异方差加噪的差分隐私直方图方法对区间树结构却有严格的要求,导致灵活性与实用性较低。为此,提出了一种异方差加噪下面向任意区间树结构的差分隐私直方图算法LUE-DPTree(inear unbiased estimator for differential private tree)。首先根据区间计数查询的分布,计算区间树中节点的覆盖概率,并据此分配隐私预算,实现异方差加噪;接着经分析指出该异方差加噪策略适用于任意区间树结构,且从理论上证明了在任意区间树结构下进行异方差加噪后,仍可在一致性约束下利用最优线性无偏估计进一步降低区间计数查询的误差。针对算法的区间计数查询精度及执行效率,与同类算法进行了比较分析。实验结果表明,LUE-DPTree算法是有效可行的。
799-810
PCM混合主存系统的写感知主存管理算法
作者:何爱华; 岳丽华; 吴章玲; 郭有强 单位:蚌埠学院计算机科学与技术系; 安徽蚌埠233030; 中国科学技术大学计算机科学与技术学院; 合肥230027; 蚌埠学院计算机科学与技术系; 安徽蚌埠233030
摘要:相变存储器(phase change memory,PCM)凭借字节可寻址,读取速度快(纳秒级),高存储密度,低能耗等优点,在目前基于DRAM(dynamic random access memory)的主存扩展达到瓶颈的情形下,已经成为最具前途的主存存储介质之一,但是PCM有高写延迟,寿命有限等缺陷,因此出现了DRAM/PCM混合主存架构。提出了一种以减少PCM写和保持命中率为目标的混合主存管理算法——写感知的CLOCK算法(CLOCK with a write-aware strategy,CLOCKW)。已有研究主要基于写临近信息(recency of writes,RW)来预测页面写热度,CLOCKW引入内在写距离(inter-write-distance,IWD)概念,并结合写临近信息来预测页面写热度,从而把写密集页面放置在DRAM。此外,CLOCKW通过记录有限的历史写操作信息,将新置换进的页面放在合适的存储介质,避免不必要的页面迁移。最后,基于CLOCK算法的CLOCKW满足虚拟主存管理的低代价要求。实验显示,CLOCKW在保持命中率前提下,可以有效减少PCM写次数。
计算机科学与探索杂志网络与信息安全
811-821
异构三维片上网络布局优化的超图划分算法
作者:宋国治; 张大坤; 马杰超; 涂遥; 刘畅 单位:天津工业大学计算机科学与软件学院; 天津300387
摘要:片上网络作为一种将大量嵌入式内核集成到单个晶圆片上的可行性技术,与传统片上系统相比,更能应对未来需要更大规模集成内核的挑战,从而得到了更广泛的应用。然而,目前大多数对片上网络的研究是在规则的架构上进行的,即假定所有单元片面积相同,但是这种假设过于理想化。因此,基于异构布局的三维片上网络的研究是非常有必要的,而其中网络单元的合理划分对片上网络的性能有着重要的影响。介绍了基于异构布局的三维片上网络架构,并将超大规模集成网络中的单元映射成一张超图,并且对此超图进行了多级划分。在算法框架的不同阶段,介绍了常见的算法,并且对相应算法的潜在问题进行分析,随后对这几种算法进行改进以提高片上网络的性能。最后,通过对几个常见的超大规模集成单元数据集进行实验分析,比较了不同阶段的算法对该片上网络各个性能的影响,并得出各个数据集上最优的hMetis算法框架。
822-837
通用型多语竞争与政策调控复杂Agent网络模型
作者:于群修; 毕贵红; 张寿明; 曾振华 单位:昆明理工大学信息工程与自动化学院; 昆明650500; 昆明理工大学电力工程学院; 昆明650500
摘要:利用基于社会圈子理论的agent微观建模技术来构建语言竞争社会网络。构建的网络拓扑结构参数更接近实际社会网络参数,agent可以赋予空间属性,可以描述混合居住和分片聚居社会网络,而且具有动态特性。以三语竞争为例,提出了一种将网络中个体间的三语竞争分解为三个两种语言竞争的问题,给出了一种基于竞争原理的通用多语竞争复杂agent网络仿真建模方法。网络上的节点agent代表具有学习和遗忘功能的个体,每个个体均可以通过学习获得第二或第三种语言成为双语或三语者,也可以通过遗忘重新成为单语或双语者,同时agent考虑了语言的垂直传播。分析了语言地位、不同语言人口比例、移动人口比例、社会半径、不同语言人口的空间居住模式、语言传承率等因素及其综合调控措施对语言竞争的影响。仿真分析表明,该模型贴近实际社会,为多语竞争提供依据。
838-846
具有第二下降点6错线性复杂度的2n周期序列
作者:王喜凤; 张伟; 周建钦 单位:安徽工业大学计算机科学与技术学院; 安徽马鞍山243002
摘要:线性复杂度和k错线性复杂度是衡量流密码强度的重要指标,通常这两个指标越大就越能抗击明文攻击。为了更进一步地研究密钥流序列,利用构造方法和方体理论分析了具有第二下降点6错线性复杂度的2n周期序列,得到了所有可能6错线性复杂度的取值形式。分析并推导了具有2错线性复杂度为第一次下降点且6错线性复杂度为第二次下降点的2n周期序列的计数公式。使用这种方法也可以推导出其他具有第二次下降点或者第三次下降点的k错线性复杂度序列的相关性质。
计算机科学与探索杂志人工智能与模式识别
847-855
基于二维局部均值分解的图像边缘检测算法
作者:陈思汉; 余建波 单位:上海大学机电工程与自动化学院; 上海200072; 同济大学机械与能源工程学院; 上海200092
摘要:针对二维局部均值分解(bidimensional local mean decomposition,BLMD)中影响算法速度的两个主要因素:自适应搜索窗口和迭代终止条件,提出了优化方法,并在其基础上提出了一种边缘检测算法。该算法采用Delaunay三角剖分得到局部极值点的理想规则化的三角网格,通过网格划分确定相邻极值点及滑动平均窗口的大小,并提出了一种新的BLMD算法迭代收敛条件,通过对人工合成图像以及自然图像的实验,证实了该优化算法与原算法结果非常接近甚至更优,且大幅度提高了计算速度。对BLMD得到的最高频分量进行直方图均衡,将其结果二值化,通过设定阈值剔除其中不连续的细小边缘,通过形态学将其骨骼化,得到最终提取的边缘。与几种典型边缘检测算子的比较实验表明,新算法可以较好地检测出图像边缘,相对于其他边缘检测算子,对于图像中的纹理等细节边缘有着更佳的检测效果;并且得益于BLMD图像多尺度分析的优势,较好地避免了因光照明暗等低频因素产生的假边缘,提取出的边缘更符合视觉上的主观检测。
856-866
可逆数据隐藏算法在医学图像上的应用
作者:袁陶希; 吴昊天; 徐依凌; 胡晓渭; 刘渊 单位:江南大学数字媒体学院; 江苏无锡214122
摘要:可逆数据隐藏技术是一种新兴的信息隐藏技术,能够在提取嵌入的信息后无失真地还原出原始信息,因此在医学、遥感、军事等领域被广泛使用。提出了一种新的基于直方图平移的可逆数据隐藏算法,解决了已有算法应用在医学图像上出现的严重视觉失真问题,同时实现了病人信息的可逆隐藏和图像的对比度增强。新算法针对医学图像的像素分布特点,改进已有算法的预处理过程,自适应地选择最优预处理区间,并利用最大类间方差法分离背景和前景区域,在信息嵌入的过程中,逐步地增强医学图像感兴趣区域的对比度,之后能够无损地还原出原始图像。仿真实验表明,新算法有效消除了视觉失真,对两类不同的医学图像均有良好的对比度增强效果,信息嵌入率也相当可观。
867-874
面向STEP标准三维实例的结构化查询方法研究
作者:刘一良; 刘弘; 王吉华 单位:山东师范大学信息科学与工程学院; 济南250014; 山东省分布式计算机软件新技术重点实验室; 济南250014
摘要:在对三维实体描述STEP标准实例数据格式研究的基础上,以STEP中性文件文本分割和解析为基础,针对STEP标准文件的“不严格树形结构”,实现了一种面向STEP标准三维造型实例数据的结构化查询方法。对STEP标准文件的操作粒度进行划分,面向不同的操作粒度,给出了相关操作规则定义,并在实验环境中得到了较好的实现效果。该方法对解决不依赖具体三维实体设计软件的实例数据的存储、管理、检索、重用及面向STEP中性文件的产品数据管理(product data management,PDM)具有较高的基础性前研意义,对改进异构设计环境下产品数据的同步和协同设计(computer supported cooperative design,CSCD)具有较高的实现意义。
875-883
基于q近邻的不完备数据三支决策聚类方法
作者:苏婷; 于洪 单位:重庆邮电大学计算智能重庆市重点实验室; 重庆400065
摘要:聚类是数据挖掘的重要技术之一,在许多实际应用领域,由于数据获取限制,数据误读,随机噪音等原因会造成大量的缺失数据,形成数据集的不完备性,而传统的聚类方法无法直接对这类数据集进行聚类分析。针对数值型数据,提出了一个基于三支决策的不完备数据聚类方法。首先找到不完备数据对象的q个近邻,使用q个近邻的平均值填充缺失的数据;然后在“完备的”数据集上使用基于密度峰值的聚类方法得到簇划分,对每个簇中含有不确定性的数据对象,使用三支决策的思想将其划分到边界域中。三支决策聚类结果采用区间集形式表示,通常一个簇被划分成正域、负域和边界域部分,可以更好地描述软聚类结果。在UCI数据集和人工数据集上的实验结果展示了算法的有效性。
884-890
多粒度空间与知识推理
作者:折延宏; 李美丽 单位:西安石油大学理学院; 西安710065
摘要:旨在建立起多粒度空间中粗糙近似算子与知识推理中认知算子之间的一一对应关系,从而给出多粒度空间中粗糙近似算子更为合理的语义解释。对于任意逻辑公式,通过分析其语义集与加了认知算子后的语义集之间的关系,证明了全知算子EG对应于多粒度空间中模型AIU中的下近似算子,公共知识认知算子CG对应于模型RU中的下近似算子,分配知识认知算子DG对应于模型RI中的下近似算子,所得结论是模态逻辑与Pawlak粗糙集之间对应关系在多当事人环境下的推广。
891-900
嵌入共轭梯度的二次学习教与学优化算法
作者:王培崇; 彭菲菲; 钱旭 单位:河北地质大学信息工程学院; 石家庄050031; 中国矿业大学(北京)机电与信息工程学院; 北京100083; 北京邮电大学图书馆; 北京100083
摘要:教与学优化算法通过模拟自然班的教与学行为实现复杂问题的求解,已经得到较为广泛的应用。为了克服该算法容易早熟,解精度低的弱点,提出了一种改进的混合混沌共轭梯度法教与学优化算法。改进算法应用Chebyshev混沌映射初始化种群,以提高初始种群对解空间的覆盖。为了保持种群多样性,引入动态学习因子,使学生个体能够在早期主要向教师学习,并逐渐提高个人知识对其进化的影响比例。每次迭代后,教师个体将执行共轭梯度搜索。种群内适应度较差的学生个体如果长时间状态难以改变,则基于反向学习和高斯学习进行二次学习优化。最后在多个典型测试函数上的实验表明,改进算法对比相关算法具有较佳的全局收敛性,解精度较高,适用于求解较高维的函数优化问题。
发表评论