Kaggle是众所周知的数据竞赛平台,为社区用户举办了一次问卷调查,调查内容涉及人工智能领域的不同维度,收集到16000份关于从业者的人员属性、工作背景,学习特征和技能特征等方面的信息,帮助打算进入人工智能领域的有识之士更好的了解行业现状,做到有的放矢,不走弯路。
数据来源::https://pan.baidu.com/s/1o7BFzFO
用户画像分析
一 人员属性
Kaggle社区的用户中,绝大部分都是男性用户,女性占比只有16.95%。年龄分布上来看,很多都是25岁左右的从业者,中位数为30岁。人员年轻化,也印证了人工智能领域在最近几年的火热程度,越来越多的年轻人涌入人工智能领域施展才能。
由从业人员的国籍可以看出,美国、印度和中国应该是人工智能领域走在世界前列的国家,在优越的经济和技术条件的保障下,从业者能更高效的实现技术落地,研发新技术。
当然,人工智能也是有一定门槛的。从业者中,42.03%的人获得了硕士学位,32.23%的人获得了学士学位,更有15.73%的获得了博士学位,学士及以上的学位拥有着占到了九成。由于大学还没有开设专注人工智能的专业,所以从业者们都来自使用相关技能的专业,最多的是计算机,其次是数学统计学、非计算机类的工科和电气工程等等,但也包括人文、社科和管理类偏文科方向的同学。
二 工作属性
上图列出了从业者工作的职位和状态,数据科学家最多,其次是软件工程师和数据分析师,有将近七成的人是全职工作者,将近一成的人是独立工作者,剩下的是没有稳定工作的从业人员。
由从事数据工作年限的图表中可以看出,1-5年的从业者占了较大比重。他们在工作中的具体工作内容可以概括为图中显示的部分,比如分析理解数据指导产品和商业决策、利用机器学习方法提高产品水平和提高工作效率、探索机器学习的新领域等等。
三 技能属性
上面两幅图是从业者在工作中涉及到的方法和算法的展示。可以看出,在数据分析方法中使用最多的是数据可视化、交叉检验和时间序列分析,数据算法中使用最多的是逻辑回归、决策树和随机森林。这些信息可以帮助打算入行人工智能领域的同学了解业内常用的数据科学方法和算法,以及遇到问题时可以着手的方向。
上图是从业者推荐掌握的编程语言,可以发现大部分人选择了Python和R。
四 学习属性
从业者们一般会通过以上几个平台学习人工智能领域相关知识,学习的方式一般有线上学习、大学学习和自学。
学无止境,从业者们在掌握已有的数据科学方法和算法的基础上,还希望学习哪些内容呢?可以从上面两幅图中一探究竟,也从侧面反映出现阶段流行的机器学习工具和算法。