一、特征重要性分析方法选择
之后再对重要因素对创新产生的影响进行进一步的拓展分析,得到影响成熟企业创新的重要因素分析结果;最后为了验证成熟企业的结论是否同样适用于成长型企业,进一步探索了成长型企业的影响因素表现,将其与成熟企业进行对比,最终得出结论。
选择有效的特征是机器学习建模过程中非常重要的一环,影响模型的效果、运行速度等各个方面。获取特征重要性的方式也会对特征重要性有所影响,在某种方式下因素的重要性较低,另一种方式下可能会比较高,若多种方法下某因素的重要性都较高则表明该因素确实重要,所以需要使用多种特征重要性的获取方式。
本文应用特征工程的知识进行重要因素的选择,主要目标是服务于现实实践,从创新投入、研发过程、创新产出3个维度进行重要因素的解读,从而指导实践。特征重要性的选择对结论有关键的作用,因而需要使用全面可靠的方法进行特征重要性的评估与分析。
本文先对现有的特征重要性方法做一个梳理,确定选择哪种方法并给出理由。用于特征重要性评估的方法分为3类:过滤法、包裹法、嵌入法,其中过滤法的思想是在建立模型前通过计算每个特征与标签间关联的紧密程度去除关联不大或没有关联的特征;包裹法的思想是不断迭代抽取的特征子集建模,通过特征子集作用下的模型表现确认最优的特征集;
嵌入法的思想则是根据特征在模型训练和优化过程中发挥的作用评判每个特征的重要程度。本文是基于多种机器学习算法拟合因素特征和企业创新水平变量的模型,各特征在模型中发挥多大的作用以及是否与标签互为单调变化等情况均是未知的,模型探索这些关系,因而本文需要的各特征重要性与模型紧密相关。
基于这种考虑,结果与模型强相关的包裹法和嵌入法是合适的,同时由于本文的目标是探索全部特征的重要性,而非选择出最优的特征子集进行模型的优化,因而选择嵌入法。在嵌入法中,具有全局一致性的是排列重要性和SHAP方法,因此,本文接下来会对全部模型进行这两种方法的特征重要性评估。
二、企业创新影响因素重要性分析
具体来看,三种模型的两种全局性特征解释方法下,前20名的特征中有12个是全部认同的,其中营业收入在所有特征最为重要,在所有特征对企业创新投入的影响中贡献度高达28.31%。
即企业创新投入金额最受营业收入的影响,即营业收入的水平最能影响投入金额的规模,同时营业收入额的大小会对企业创新投入金额产生大的波动,可能的原因是在高技术制造业企业中,研发活动的资金投入主要来源于企业自身经营活动创造的收益;
其次是总资产,总资产通常是企业规模的体现,即规模大小不同的企业在研发资源投入的配置差异较大;然后,政府补助也是企业创新投入金额的一个重要影响因素,政府补助既是企业进行创新研发的一个资金来源,也意味着对企业创新活动的鼓励和监督,其综合效应对企业创新投入金额有较为重要的影响;
最后我们还发现一些特色指标的特征也在重要性排名中靠前,如被研报关注度,受资本市场的关注程度在企业投入时即发挥了影响;技术市场成交额代表技术市场的活跃程度,在本文代表着知识产权保护在企业所在区域发挥的效应,即企业所处区域的知识产权保护环境影响了企业对创新投入资源的配置;
除上述全票通过的特征外,5票中获得4票认可的特征里,注意到企业创新文本特征这一在以往文献中研究较少的特征也发挥着较为重要的作用,企业创新文本特征在本文是指企业管理层对企业创新的关注程度,也即企业的创新战略,意味着企业对创新战略的重视程度影响着对创新活动的资金配置。
企业盈利水平和规模决定着企业创新投入资金的规模,体现在营业收入、资产总计、主营业务收入、员工人数、净利润等代表企业规模和盈利水平的因素全局贡献度达到49.37%,在重要因素中比例超过一半,这表明成熟企业投入创新活动的资金规模几乎取决于企业自身的盈利水平和资产规模;
其次是财政政策,包括财政补贴和所得税,主要在于缓解企业资源困境,表明财政政策对于企业进行创新活动的意义明显。企业在人力上的创新投入与在资金上的影响因素不尽相同。在最重要的因素上,研发人数占全部员工人数的比例首先受员工总体学历以及员工总人数的影响,也就是说,在高技术企业中,员工规模和受教育程度本身对员工的分工配置有较大的影响;
其次,管理层的配置也对企业投入创新人员有重要的影响,主要是具有研发背景的管理者比例,可能会影响到管理团队对企业创新的关注度,从而对创新投入产生影响;然后可以注意到行业内公司总数、市场占有率HHI、市场集中度CR_5等市场竞争因素对企业投入研发人员起着重要作用,即市场竞争激励着对创新型人才的需求;
政府补助对企业投入研发人员有重要影响,即政府扶持影响高技术企业人力上的配置;再次,员工责任的履行对研发人员占比也有较为重要的影响,员工责任包括企业支持给员工薪酬福利的基本责任、重视员工幸福感的方方面面、培养员工就业能力等多方面责任,员工责任履行得好,越能树立企业良好形象。
越能够加强对优质人才的吸引力和领导力,在创新活动中研发人员发挥着核心作用,员工责任的履行对研发人员占比有着重要影响。与研发投入人力的投入最为密切的影响因素是企业员工教育水平和员工责任的履行以及企业规模,其次市场竞争和财政政策相较投入金额维度发挥了更为重要的作用。
总资产、员工人数是影响企业创新效率最主要的因素,说明企业规模带来的资源差异对创新产出效率有着非常重要的影响;其次可以注意到,企业现金流对于创新效率的影响很大,在重要性排名前20名的影响因素中,债权人现金流量、自由现金流、股权自由现金流均在其中,全局贡献度共计近10%。
另外,行业内公司总数、市场集中度CR_5也有着较高的重要性,HHI是企业在行业中的市场占有率,代表着企业在行业中的竞争力和地位,在高技术企业中更间接代表了企业的综合实力和创新能力,在创新效率上占有较高的重要性,说明行业竞争对企业创新效率有重要影响,不同竞争情况的行业中企业的创新效率可能有所差异;
再次,在影响创新效率的重要特征中,相比投入维度增加了一些管理层相关的特征,包括管理层学历、管理层中女性人数占比、高管薪酬以及第二至第十大股东持股比例,说明企业的创新产出能力与管理层有重要关系。
管理团队的配置和激励机制、股权集中度对企业创新效有着重要影响;此外,外资投资总额是指外资向某区域企业投资的总金额,代表着企业所在区域的对外开放程度,外资投入通常会增强国外技术的引入与交流,对企业的技术能力产生影响,从而影响效率。