人工智能与数据挖掘
随着人工智能领域受到关注,数据挖掘也逐渐被人提起。其实数据挖掘并不是新东西,它在很多年前就被提出来了。从上世纪70年代开始,数据挖掘历经电子邮件阶段、信息发布阶段、电子商务阶段、全程电子商务阶段,发展至今已经近半个世纪。
信息时代,大量沉淀、冗杂数据大多难以被有效利用,其中包含的价值就像待挖掘的矿藏。而数据挖掘就是挖掘这些数据价值的技术。
数据挖掘往往与机器学习分不开。海量的数据作业,只有机器能高效率的工作,常见的有分类、聚类、关联规则挖掘、个性化推荐、预测、神经网络、深度学习等。数据挖掘一般是从大量的数据中通过算法搜索隐藏于其中信息的过程,其本质更像是机器学习和人工智能的基础。例如,大学的招生办公室可以通过数据挖掘模式,找出除了传统的GPA和标准化考试之外影响学生日后在校表现的其他因素。
在数据挖掘的过程中我们长期以来使用传统统计方法或软件工程来处理数据科学领域的工作。但是在有了人工智能以后,便可以做得更有效率更出色。如根据过去的数据预测未来的情况,如天气预报或股市分析;区分照片中的是一匹斑马还是一匹普通的马;文章的叙述是正面性还是负面性的;分析照片中人物的年龄;汽车预期的燃油效率等等。
大家逛淘宝、抖音、今日头条时不难发现,它们如此了解你,是因为人工智能做到了智能分发、个性化推荐系统等技术应用。今日头条的个性化推荐十分精准,简单说就是你在今日头条上的阅读行为、视频点击播放习惯、查看与参与回答的悟空问答问题都会被记录下来,形成极具个性化的属于你自己的推荐算法。也就是说每个人看到今日头条的信息流是不一样的,点击越多,同类话题或主题的文章、图集或视频就会更多的展现在你的面前。
随着互联网的发展,我们即将迎来数据的全面爆发,海量的文本、视频、音频数据需要进行处理。如何将人工智能与数据挖掘更有效的结合,多方位、全方面挖掘数据带来的价值,如何将这些价值实际利用到产业链上去,这些都是下一步值得思考的问题。
(四川经济日报记者 王典珺)
新闻推荐
到2022年,全省种植花椒600万亩,实现综合产值300亿元本报讯(记者吴平)记者9月6日从省林业厅获悉,《推进四川花椒产业持...
四川新闻,新鲜有料。可以走尽是天涯,难以品尽是故乡。距离四川再远也不是问题。世界很大,期待在此相遇。