【摘 要】
:
随着大数据发展的今天,越来越多的数据被人们广泛利用起来。无论是人们在医疗机构留下的信息,还是在网上购物时留下的浏览痕迹,或是浏览网页的地理位置。这些庞大的数据被记录着
论文部分内容阅读
随着大数据发展的今天,越来越多的数据被人们广泛利用起来。无论是人们在医疗机构留下的信息,还是在网上购物时留下的浏览痕迹,或是浏览网页的地理位置。这些庞大的数据被记录着,并且被广泛利用。经过对这些数据的分析得出他们所要的用途,我们即欣喜的看到,数据分析给我们生活带来的改变,又对越来越庞大的数据集感到束手无策。对于如此惊人的数据,人们开始利用机器进行学习,经过对数据的处理和研究,我们发现许多机器学习的数据(度量学习,k的特征值)及数据的管理问题,我们都可以用矩阵的形式表示。现实中数以百计的数据,数据分析技术的空间和时间的复杂随着数据问题的增大呈现二次方增长,使得大规模数据标的不可习惯,因此本文受非负矩阵的影响,提出了新的算法。排序是信息检索中的核心问题,是如何让用户可以更快的找到想要查询的内容。对于排序问题,我们主要有两个方面的研究:(1)判断相关性,网页的文档内容作为判断的基础,以此判断出文档和用户查询的相关性。(2)判断重要程度,根据链接进行页面重要性的判断。越来越多的排序方法被提出,但是我们提出了利用数据的聚类,对要查询的数据进行分类的方法。在此方法中,我们逐步改进了数据聚类的方法,对其最优值和收敛性进行了讨论,经过比较,我们提出的双图正则法可以有效的对数据进行聚类,使其排序速度加快,响应时间缩短。在我们建立的排序聚类模型中发挥重要的作用。本文主要讨论就是将低秩矩阵结合现在的流形算法中,使其聚类的精度和速度有所提高,从而优化查询排序问题。(1)我们证明了一个快速算法解决低秩二次半正定优化问题。我们讨论了非凸的二次矩阵半正定优化问题,虽然问题非凸,但是这些问题有其特殊结构,使得局部最优解就是全局最优,并在一系列机器问题上得到证明。(2)利用流形数据和前一章的低秩结构建立了双图正则的非负矩阵,我们利用前一章的证明结果,证明了模型的最优性,及收敛性,该框架考虑了数据流形及几何流形的特征,经过试验比较这种算法的聚类性更好。(3)将这种聚类性更好的算法应用到排序模型中,对数据进行建模,然后利用双图正则进行聚类,对于新的查询数据,判别其分类,对这一类对应排序函数应用到查询的对应文档中,从而得到排序的结果。
其他文献
数字高程基准模型是现代测量定位的参考框架,同时也是研究相关地球科学的重要基础数据。因此,构建高分辨率高精度的区域数字高程基准模型具有非常重要的科研意义和工程实践意
本文研究t-模的旋转不变性.首先,我们给出了旋转不变t-模的基本性质,我们讨论旋转不变性与其它t-模的性质之间的关系,主要包括旋转不变性与t-模的左连续性、幂零性、矛盾律、
本文研究快扩散非Newton渗流方程的Cauchy问题的临界Fujita指标.除了在快扩散非Newton渗流方程中的非线性奇异性,该方程还具有奇异系数,而且在无穷远点处是退化的或奇异的.这
沥青路面厂拌热再生技术能够高效回收、利用废旧沥青路面材料(RAP),且再生混合料性能良好,寿命周期内较其他再生方式、铣刨重铺等具有显著的环境和经济效益,因而成为公路交通可持续发展的重要举措,在国内外得到广泛的研究和应用。如何保证热再生沥青混合料性能是厂拌热再生技术关注的重点问题,而级配是混合料性能的先决条件,目前还未形成有效的热再生沥青混合料级配评价方法和体系,在RAP掺量确定、级配设计等关键环节
随着信息化社会的不断推进,ABC(人工智能、大数据、云计算)的产生,各行各业在不同层面上进行不断的变革,其中最为显著的制造类企业逐步走向了转型的道路,在生产过程中随着生产过程的持续,各类数据呈几何倍数增多从而导致在众多数据中挑选所需的数据更是难上加难,况且人对数据的判断一向次于对图像的直观感受,因此便运用可视化技术通过Echarts图表工具对数据进行处理,以图像的形式从新的视角出发来感知生产数据的
可用数字信息的数量和互联网访问者数量的爆炸性增长带来了信息过载问题,阻碍了用户迅速及时的访问Internet上感兴趣的物品。推荐系统的目标是根据用户需求结合用户历史偏好,为用户推荐满足其需求的物品或产品。尽管目前在该领域已经有大量研究,但是大多数现有方法侧重于向用户推荐最相关的物品,而不考虑任何其他信息,例如时间或同伴等。事实上,用户对物品的选择会随时间、天气(上下文信息)等因素变化,在推荐过程中
分形一词的创始人Mandlebrot曾经说过:事实上,无论是从美学的观点还是从科学的观点,许多人在第一次见到分形时都有新的感受。自然、复杂、优雅、玄妙的分形图让许多数学家、计算
石枣子(Euonymus sanguineue),是卫矛科(Celastraceae),卫矛属(Euonymus)多年生落叶小灌木或小乔木。世界上卫矛属植物大概共有220种,其主要分布区位于亚热带和温带地区,如亚洲、欧洲
在本文中,我们考虑Hilbert空间中的一类非自治随机微分方程,证明其在依分布意义下具有带加权伪的概自守性质的解是存在并且唯一的.为了实现我们的证明,推导过程中利用了指数二分
二氧化硫(SO_2)主要来自于煤以及化石燃料的燃烧,它是形成酸雨以及雾霾的主要原因,对大气环境和人类的健康带来了严重的危害。目前,工业上应用的传统脱硫技术存在副产物处理困难以及二次污染等问题。咪唑基功能化吸收剂由于良好的脱硫性能,本文设计了多位点水溶液混合吸收剂以及咪唑基低共熔溶剂用于SO_2的捕集过程。本课题首次设计并制备了咪唑衍生物三(2-(1-h-咪唑-1-y1)乙基)胺(TIA)并与水形成