什么叫大数据?.有什么用?.

地点选择:绝不出国,向往南方

咱们内地的民谣歌手似乎都不——出——国!不管是因为不喜欢异域风情还是语言水平不过关,反正他们的歌词里极少出现外国地名。丽江香格里拉也好,婺源平遥也罢,腾冲漠河也可以,歌词里的地名越质朴越好。尤其是跟那些“浮夸”的流行歌手们比起来,咱们的民谣歌手真算得上国内旅行发烧友了。比如下列流行歌曲的歌名:

Twins《莫斯科没有眼泪》

周杰伦《米兰的小铁匠》《伊斯坦堡》《土耳其冰淇淋》

蔡依林《许愿池的希腊少女》《马德里不思议》《布拉格广场》

根据统计,虽然民谣歌手最爱歌颂的城市是北京,可大家最向往的要不然是“南方”(就像万晓利曾经说过,如果你不来南方,就会去那北方的北方),要不然是北京以南的城市(可能《杀死那个石家庄人》也算。)

如果真出国了怎么办呢?

少数在歌曲中出过国的民谣歌手可能就是陈粒了,即便这样,她也只去过东南亚。为了跟其他民谣歌手保持调性上的一致,她甚至写了首《我只去过东南亚》,歌词意思大约是:我跟你陈绮贞不一样。

如果你品尝过夜的巴黎,在土耳其埋葬过记忆,还收了行李下个星期要去英国,对不起陈绮贞wannabe,你不属于内地民谣圈。什么,你问我布衣乐队的《罗马表》难道不是国外——你再读读歌词!

在时间上,民谣歌手最青睐凌晨,究其原因可能是多年不早起,生物钟紊乱,灵感多迸发于下午两点的马桶,并持续到凌晨的最后一根烟上(前一天忘了买,现在老王的小卖部关门了)。晚上表演后,歌手可能陷入酩酊大醉状态,容易错过晚班公交/地铁,打不起车,走路绊跤,当街大睡,所作歌词也会同时有星空、街头、梦、姑娘、孤独等意象。

叙事语焉不详,不知道发生了什么

我来过,你的孤独与倾听

你一微笑我就失言成一叠长信

我来过,你的不安与认定

你一睡着我就深爱成一片阴影

我来过哪里?我在干什么?我要往哪里去?

——海龟先生《玛卡瑞纳》

不然呢,“你叫她欧阳二丫”?“这张是我的门卡”?

不得不佩服每天下午两点起床的民谣歌手们的人生经历,啊不,造句能力的丰富。为了应对每天重复的生活和出歌的压力,民谣歌手们的做法一般是收集一个高频词库,然后抽出一个词造句,随后开始脑补故事。如果故事找不到,或者写词主打蒙太奇的风格,那么就再抽出一个词,造个词组,如此循环往复,直到字数凑够。

当然,如果真的造不出句子,也没问题。君不见那些出了半张专辑就“全国巡演”的乐队呢……

他们在别有用心的生活里翩翩舞蹈

你在我后半生的城市里长生不老

“大数据就是传统BI的简单升级,其实就包装卖点”

那不出意外,这个人一定是个传统BI商业智能的从业者。

传统BI已经过时了,BI产品无法适应大数据时代

那么,恭喜你又遇到了一个大数据 从业者。

那么,这两者到底有什么区别,也是好多客户面临的问题,希望本篇文章能给大家一个更佳清晰的认知。

1、大数据和BI两者的区别

BI=商业智能,他跟企业或者机构的业务息息相关,没业务就谈不上BI,因为BI产品是企业数据化管理方案中的一个必要的因素,他要帮助企业整合数据,并提供管理者生产报表的功能呈现数据分析维度帮助管理者作出明智的业务经营决策,数据运营,数据营销都是这类问题。

大数据,第一点区别是对企业拥有庞大的数据进行抽取,管理,处理,这些数据可以是非结构化的,或者看起来无用的数据,也可以是结构化的数据集合,这些数据是需要重新处理才能挖掘出价值。而这些数据是海量,高增长和多样化的信息资产。大数据更侧重解决某一类问题的方法,比如全网的用户画像,用户言论,以及对海量的非结构化物联数据的分析。

不管定义有什么不同,或者还有多少种解释,大数据与传统BI是互联网以及数字化建设发展到不同阶段的产物。大数据对于传统BI,有继承也有发展,BI与大数据区别在于前者更倾向于业务决策,对事实描述更多是基于历史数据的共性,帮助决策者掌握宏观统计趋势,适合经营运营数据支撑类需求,而大数据则内涵更广,倾向于刻画个体,更多的在于个性化的决策分析。

所以站在客户的角度来讲,两者可能都是他们需要的,而这两者也确实可以在一定程度上共用,因为两者几乎都是从数据->信息->知识->智慧。

2、两者技术上有什么相关性?

etl,数据库,可视化报表,OLAP等

可以说大数据和BI既有区别,又有相关。

传统BI就目前来讲,其功能都可以被对应的大数据组件所替代,但大多数企业缺乏大数据业务的驱动,也缺乏相关的高技术人才,BI更好理解,大数据更加专业。

如果我们将BI架设在大数据的应用层,利用etl抽取数据在结合大数据的架构,利用大数据算法构建业务模型,得出结果后在结合通用类的业务分析。既满足了海量实时数据分析,也满足了决策型的业务分析。这可以说是新型的BI系统,也可以说是贴合业务场景的大数据系统。

3、作为企业我们到底选择什么技术?

在技术领域,虽然传统BI的一些技术难以解决日后海量数据的处理问题,但是,也不能全盘否定或替代成大数据。一些企业采用SAP HANA,FineBI的直连大数据引擎都是基于这个问题优化的方案。所以说并不是每个企业都需要打造自己的大数据平台,需要考虑到企业的信息化水平和更新成本,建议根据实际需求,可以自行研发 ,比如BAT;也可以选型采购,比如传统大企业;

目前一些大数据产品已经开始重视用户场景,使得整体架构更佳适合大数据管理和分析,再结合上层的场景化分析让大数据容易落地,更好的支撑决策。例如:德塔精要有一款大数据平台叫做智慧中枢,就建立在大数据架构上并深耕业务场景,让大数据产品更好的服务于具体的行业。

大数据 VS 商业智能

大数据的发展还需要时间,大数据技术并不重要,重要的是用全新的数据技术手段如何来拓展和优化业务?传统的数据支撑,大多是利用数据历史趋势,在感官上预估结果。举了简单的例子,一个人经常犯错误,我们就可以判断本次任务他犯错误的几率较大。这在一定的条件下确实比较直接有效,但问题是历史数据趋势并没有这么明显,如果两个人在历史数据中状态相当,我们又如何判断呢?

基于大数据的算法,我们可以利用更多的维度信息,比如:年龄,职位,奖惩,健康,结婚情况,等等表面上毫无关系的数据,来建立模型,并利用大量的真实的数据让模型自我学习,这样再出现一个任务时,我们就可以在两个貌似没有差别的人中,选出更佳适合的人选,这也是传统BI无法实现的,大数据的魅力所在。

即使如此,传统BI仍旧有大量的市场需求。大数据普及还需要时间,但大数据对BI不仅仅是简单的包含的关系,它涉及了思想、工具和人员深层次的变革,所以大数据绝对不是BI包了一个高大上的空壳,但大数据也千万不要高高在上,它需要更加贴和行业场景,解决实际的业务问题,让自己更好的进行落地。

本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击。

  2018年10月16日,第三届UBDC全域峰会在北京富力万丽酒店举行。本届峰会以“DI·进化”为主题,数十位国内外数据大咖、十余家黑科技企业出席,打造了 场大数据盛宴。清华大学博士、南京大数据研究院院长、中国大数据应用联盟人工智能专家委员会主任、云创大数据总裁刘鹏教授受邀参加并作主题报告。

  在上午的“DI·进化”主论坛中,刘鹏教授以“进化:从大数据到人工智能”为题,向所有在场和观看网络直播的观众作报告分享。他详细分析了物联网、云计算、大数据和人工智能的发展和应用,并为现场观众介绍了大数据和人工智能给人们生活带来的便利和影响。观众听完报告,为刘鹏教授的精彩观点纷纷点赞。

  本次峰会设DI进化主论坛、数据化运营论坛、数据营销论坛、智慧零售论坛及智慧金融论坛五大会场,汇聚包括李宁、蚂蚁金服、阿里云、 点资讯、Keep国内外知名企业大咖参与分享。嘉宾们深度解读了互联网运营、数据营销、智慧零售、智慧金融等数据智能案例,围绕人工智能、IoT、数据化运营、数据营销、智慧零售、智慧金融等前沿热点话题进行讨论。

  刘鹏教授主要围绕以下几个方面,作报告分享:

  第 ,物联网、云计算、大数据和人工智能的关系

  富士康准备淘汰近 半的工人,为什么呢?因为现在有大量的机器人进入了工厂,自动生产代替了人工生产。青岛和上海的 些码头也已经变成全自动化的,整个码头只有几名工作人员,但是吞吐量却远远超过以前。以前双11货物堆积如山,但是这两年的双11,货物很快就可以到达,因为人工智能进入了物流环节。我们以前购物只能去菜市场和超市,吃饭要去餐馆,现在足不出户,在家里也可以订餐,订各种各样的服务,生活变得非常便利。

  我们现在进入了 个新的时代,从物联网到云计算,到大数据,再到人工智能,新 代的信息技术设施已经逐步形成了。其中,物联网解决的是感知真实的物理 ;云计算解决的是提供强大的能力去承载这个数据;大数据解决的是对海量的数据进行挖掘和分析,把数据变成信息;人工智能解决的是对数据进行学习和理解,把数据变成知识和智慧。

  在这四个层次中,物联网是在数据的采集层,云计算是在承载层,大数据是在挖掘层,人工智能是在学习层,所以它们是层层递进的关系。如果要说物联网会变成什么样?大家都看过《阿凡达》,万物的感知都可以汇集到到潘多拉星球,可以感知到整个星球的状态。我们越来越多的东西在联网,我们每个人的手机里面有GPS,有陀螺仪,有加速度传感器,越来越多的传感器在感知,整个

  ,丰富的大数据应用

  云创大数据构建了大数据公共处理平台——DataCube数据立方大数据库,专门处理挑战性的海量数据。此外,万物云平台是 个免费的平台,用户可以通过连接所有的传感器,然后再访问万物云,就可以把传感器对接到这个平台上,帮助用户管理所有数据。A8000超低功耗云存储系统,其机架可以承载3800TB的容量,平均功耗只有2000多瓦,可靠性非常高,该系统可以使用十年以上,成本非常低。

  以前对付雾霾的方法,都是靠国家的监测站,数据虽然很准确,但是由于成本的原因,数量很少。云创也用大数据去应对雾霾问题,并且从7年前就构造这样的节点,通过大规模布设网格化的监管节点,从而准确定位污染源,去应对雾霾。我们对工业园区污染源的区域,对每家企业进行监测,较后形成广泛的能够采集各种现实 的状态,去控制每 个污染源的环境。所以,我们能够追踪 的雾霾。

  南京市秦淮区面积53平方公里左右,在这个区域中,云创共铺设了53个节点,平均每平方公里都有 个节点,有任何污染源出现都可以得以定位。我们不仅能知道过去的所有情况,还知道污染源演化的过程,更能知道明天、后天、大后天污染情况怎样,这是通过人工智能对未来做出的预测,该判断比人类判断要准确得多。云创大数据开发的环境云平台,将所有采集到的数据向社会免费开放,用户通过它可以构建各种各样的应用系统。现在已经有2954个单位连到该平台,通过访问我们的数据,每天会有大量的数据得到调用,从而对 所有的环境进行实时的监测。

  众所周知,地震的传播速度非常慢, 秒钟只传播3.7公里,如果有足够多的预警节点,就可以在地震到达前提前预知到地震。云创正在用大数据构建地震预警平台,该平台就是环境猫,我们正在 布设100万个地震监测节点,从而做到在地震发生的时候能够提前预警。除了地震预警,环境猫还可以监测室内的甲醛、PM2.5、温度、湿度等室内环境。同时,我们在南京秦淮区布设了燃气预警云平台,可以通过大数据监测每 家餐馆。如果燃气泄露就会预警,过去 年的时间已经发出了8000多次警报,使得每 家餐馆能够及时的排除隐患。

  第三,前沿的人工智能应用

  通过人工智能可以整合所有的视频监控,提升城市的管理水平。目前,南京和宜昌的视频监控都通过云创产品(应用)进行整合。我们开发的模糊人脸智能对比系统,可以判断视频中的人是谁,也可以识别犯罪现场的嫌疑人。这些人通过正常的人脸识别算法无法找到,但是通过新的模糊人脸识别算法,可以使大量的未破案件得到破案。另外,目前车牌的识别虽说相对比较准确,但相对所有车牌算法云创可以做得更加准确。目前人脸识别系统已经开源,不久车牌识别系统也将开源,用户不用注册,不用付费,即可以使用。

  云创开发的铁路安全智能检测系统,可以通过人工智能去判断铁路沿线的各种异常情况,使得预警变得实时。城市交通智能优化系统,可以用人工智能去控制整个城市的交通,使开车的效率大幅提升。目前,我们用人工智能已经做了人工的大脑,对整个城市的交通进行实时的优化,使人类社会变得更加美好。此外,不少单位通过云创开发的智慧路灯伴侣云平台去管控城市,使城市变得更加安全,更加环保,更加有效率。

  云创也正在通过人工智能去判断疾病,通过与南京鼓楼医院合作,我们在前列腺癌的早期诊断结果方面已经可以做得非常准确,准确度甚达到了99%以上,并得到国外媒体的广泛报道,包括福布斯和泰晤士报等。我们也在运用人工智能去做宫颈癌的筛查。所有这些都是云创大数据所实现的,云创也是江苏省发展较快的高科技企业之 。

  云创大数据教授联合国内多所高校从事 线教学科研任务的专业师资,编写了本科和高职(专科)的两套涉及云计算、大数据、深度学习等领域的教材,可为大数据教学提供系统的教材支撑。云创也会定期或不定期举办免费的公益培训,在过去三年中培养了大量大数据和人工智能师资,且好评如潮,顺利帮助 越来越多的的高校开设了云计算、大数据、人工智能等方面的课程。

我要回帖

更多关于 大数据的大是什么 的文章