返回首页

阅读次数:  498

李为民先生报告解读 ┃ 大数据驱动的智能应用:机会与挑战

2023-04-25

3月3日下午,在2023年栖霞“科创江苏”工作推进会暨数字赋能产业论坛上,李为民先生应邀带来一场题为“数字赋能——产业招商及企业风控”的主旨报告。李为民先后获得清华大学学士学位,美国威斯康星麦迪逊大学硕士学位,是清华“智库2861”项目组技术负责人。本次报告中,他深度分析了数字赋能产业的问题与挑战,解析数字经济推动产业招商及企业风控的能力。

微信图片_20230530102844.png

3月3日下午,在2023年栖霞“科创江苏”工作推进会暨数字赋能产业论坛上,李为民先生应邀带来一场题为“数字赋能——产业招商及企业风控”的主旨报告。李为民先后获得清华大学学士学位,美国威斯康星麦迪逊大学硕士学位,是清华“智库2861”项目组技术负责人。本次报告中,他深度分析了数字赋能产业的问题与挑战,解析数字经济推动产业招商及企业风控的能力。

微信图片_20230530102920.png

关于数字经济,我们应认识到其希望与挑战并存的现实。数字经济本身具有美好前景,但当数字经济投入至各产业中,实际也面临诸多问题,到目前为止未达到预期效果,核心原因需要在算法、数据和软件方法论方面长期持续地下苦功夫,而这些类似于“扫地僧”的工作,是达不到社会和资本层面所希望的“吹糠见米、立竿见影”的效果,而to G用户通常都是关注后者。所以,笃定潜行地积累技术的大数据公司成为了稀缺资源。

针对大数据,有诸多不同层次问题亟待厘清。首先关于大数据的用途,李为民先生以担保系统为例,形象解释了大数据在数据获取、沟通交流、信息处理方面的强大能量。“面对那么多企业我保给谁?入场调查、尽职调查每家企业的重点都不一样,系统能否快速列出我所需要查看企业的主要问题清单?如果担保300家企业,这些被担保公司任何爆雷我都有责任,我怎么监控已经被担保公司以及如何来管控他们的风险?”他指出,“我们库里面有产业链5万多条,产品链有200多万个,区域具体涵盖2861+337城市,网格覆盖了无穷个核心商业区,这么多海量信息是需要大数据来处理分析的。”

微信图片_20230530102946.png

其次对于信息情报的获取方式,以美国中央情报局成立公开中心、CIA设立公开来源中心为例,可以知晓真正的数据是来自于对普通信息的系统化算法分析,是基于算法长期的处理而获得的核心信息,而非大众认知下的在公众口中的关键数据。至于对关键数据的理解,实际上大数据是为了挖掘异动、挖掘真相和挖掘深度的知识。讲到知识普及就不得不提ChatGPT,这是一个颠覆性的革命,它带来整个知识产业的升级,但是在深度的、有专业数据+逻辑构建的深度的知识,尤其是决策辅助的深度知识,还是需要专业的深度数据库来提供,这就为智库2861这样的专业深度数据库提供了面对客户的chat类工具。

因为博弈无处不在,所以“关键数据”通常会搀假——经过包装的、隐藏自身问题。而放眼全球对信息数据产业有所涉猎的公司,其核心的、关键的竞争力已非数据而是对海量普通数据进行算法挖掘的软件系统。软件系统通过算法,对企业存续的呼吸数据进行挖掘处理,用数万个维度的呼吸数据挖掘出企业的异动,由此反应真相,挖掘更深度的情报。

微信图片_20230530103016.png

国内大数据公司和人工智能赋能公司的通病在于不重视积累全量企业数据的基础工作,因为这在技术上需要依靠算法,耗时长、见效慢,也因此更需要依靠软件系统方法论来让普通的算法和统计手段形成7x24的捕捉和分析能力,这些都是需要长期代码量积累的,以销售为导向的公司,无法坚信,更无法坚持。对于大数据之“大”,多大才算大?他指出“不谋全局,便不足谋一隅”,业界的其他企业大数据系统的弱点就在于太急,实际上他们手上对算法的积累、对数据的积累,以及用系统方法来解决问题的积累,整体上都表现出对这种方法论的坚信不够,甚至是没有方法论的坚信,偏离了积累全量企业数据的基础工作,偏离了建立系统的统计手段的方法论。

大数据是对基础算法的坚信和长期积累——大数据是长期主义,而对于“长”的定义也不绝对,就此提出了三个维度的看法,一是数据算法能力,其增长速度是否指数化?二是算法效率是否与算力成正比?三是公司经营了一年之后无论盈亏,主要看算法是否增加了,如果算法增加了就是成功。

微信图片_20230530103042.png

最后智库2861呈现了过去九年为国家级智库提供的相关数据库,它依托清华的平台所提供的支撑系统,包括了“高质量发展指数”、“城市体验指数”、“地理网格大数据”、“国家治理现代化指数”、“政府公共服务能力”、“民情民心指数”、“2861区县画像”、“全国交通通勤大数据”、“债务风险分析”、“长江流域经济区”、“城市高质量发展对比”共12个国家级智库。其中,“城市体检指数”是住建部门提供的第三方独立的、完全数字格式化的关于中国每个城市每个月的体检报告。“地理网格大数据”时时刻刻在统计,可以同时产生7000多个机遇网格即产生7000多个数据。“国家治理现代化指数”用于监测各地数字政务运行情况,主要是从用户获得感角度进行评估。

微信图片_20230530103122.png

此外,针对论坛主题,他重点介绍了去年落地的、支持中国所有2861个区县及337个城市的产业招商数据大脑,实现了从信息到决策一站式服务,平台化数据集成以及云端数据按月更新等功能。这套“招商大脑”一共包含四个工具,分别为“淘企”、“值不值得招”、“发现亮点与不足”和“现状”。

微信图片_20230530103150.png

第一个工具“淘企”,用于检索企业。例如,输入行业——“新能源”,然后输入地区——“栖霞区”,就能得到栖霞区新能源方面企业列表。假设栖霞区政府想要去浙江进行招商,输入浙江的城市和行业名称,就能够得到浙江新能源企业列表。第二个工具“值不值得招”用于判断引进远地企业的价值与风险,快速计算对本地就业、利润、人才方面的影响。例如输入栖霞区本地企业,企业产业规模、产业结构、产业发展分析的方方面面都会呈现出来,可以在全国全省范围内进行对比找出亮点及不足,这项分析不仅利用了本地数据还有全国数据,基于点位排序,通过数据之间比较产生相对的关系。

微信图片_20230530103219.png

微信图片_20230530103224.png

第三个工具“发现亮点与不足”,只要输入栖霞区本地企业,就能从产业规模、产业结构、产业发展各方面与全国全省进行对比,形成专业完整的报告。第四个工具“现状”包括信息技术、智能制造、大健康、节能环保等方面的发展数据,通过全国对比序列每周形成数据报告。

微信图片_20230530103300.png

李为民先生的报告针对大数据与算法应用进行了详细阐释,并结合产业融合话题探讨了当下面对数字经济企业所遇到的风险与挑战,最后还介绍了由其所成立的智库2861参与并落地的信息数据资源利用工具。通过数据赋能产业的相关主题报告,分析难点,找准痛点,并以实例为大家描绘了一幅数字化蓝图,同时也开启了与会成员更多关于数字生态的畅想。

责任编辑: 江苏省苏科创新战略研究院

江苏省苏科创新战略研究院

扫码关注微信公众号

  • 江苏科技智库

  • 科创研究