flume包用于数据的采集 flume的包。flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力 。Client:Client生产数据,运行在一个独立的线程
基于神经网络的安卓识别图片 将tensorflow训练的模型放入android中实现手机的智能识图,经过优化后,app大小只有60M左右,可以识别1000种日常的物品,每一个类别又有小分类(如狗的种类)。
大数据框架的部署 zookeeper,kafka,storm,flume,spark的部署安装。安装之前要确认安装好了oraclejdk,如果系统自带OpenJDK,需要先卸载,可以参考cdh的安装文档kafka和storm依赖zookeeper,所以要先安装好zookeeper并启动之后才能启动storm和kafk
kafka安装包 kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。
android基于神经卷积网络的智能识别 传统的图像识别对机器的性能要求较高,运行时间较长。传统的旅游景点图像识别准确率严重依赖于耗时费力的人工特征设计。以上特点明显不符合于本次科研训练。故本文利用深度卷积神经网络强大的特征学习和特征表达能力来自动学习各个旅游景点特征,并借助迁移学习方法在TensorFow深度学习框架下,将inceptio
社交网络影响力最大化研究 随着互联网的发展,社交网络得到飞速的发展,基于大规模人群进行社会影响力的度量首次成为可能。社交网络相关领域的一个关键问题就是影响力最大化问题。影响力最大化问题从“口口相传”和“病毒式营销”到“马尔科夫随机场模型”,最后成为社交网络领域的一个研究热点越来越多的学者提出了各种算法来求解社交网络上的影响力