让纾困政策跑在受困企业前面

让纾困政策跑在受困企业前面

新华社北京2月27日电 题:让纾困政策跑在受困企业前面——权威部门详解中小微企业和个体工商户扶持政策

新华社记者刘红霞、吴雨、高亢

例如,一个健身视频可以同时做“腹肌”和“腿”,或者同时做“有氧”和“力量”。该视频的特征区域为“腹肌+腿”,健身类型为“有氧+力量”。

在此之前,有学者研究发现新冠病毒似乎“偏爱”男性。2月10日,中国和美国研究人员在医学类预印本平台medRxiv上发表了一篇文章已指出,对截至1月26日8866例新冠肺炎报告病例分析发现,确诊病例男性占比55%,而在重症患者中男性占比61.5%。在死亡率上,男性患者死亡率大约为4.45%,女性患者为1.25%,男性死亡率为女性的三倍。而老年男性患者的死亡率更是高达9.47%。

目前,央行正着手增加再贷款、再贴现额度5000亿元,重点用于中小银行加大对中小微企业信贷支持。同时,下调支农、支小再贷款利率0.25个百分点至2.5%。

此外,作者发现num_same_area和area_full,两个特征也是相关的,这个发现有点令人惊讶,接下来开始解密。

就在两天前,国务院常务会议研究决定,鼓励金融机构对中小微企业贷款给予临时性延期还本付息安排,并新增优惠利率贷款;部署对个体工商户加大扶持,帮助缓解疫情影响纾困解难。

在形成这些关键字列表后,作者还提取了词干。这是为了确保计算机能够识别近义词。例如,ABS 是 Abdominal Exercise(腹部锻炼)的简写,单词“abs”和“ab”有相同的词干“ab”。

接下来请看下面特征工程的具体过程。

作者发现length(视频长度)和 calories特征是相关的。这个发现很直观,因为健身的时间越长,消耗的卡路里就越多。

在此过程中,他们转换分类特征(categorical features):area和workout_type。这种转换确保每个类别级别至少有K个值。

由于前一步的工作,现在有 3 个关键词列表和精简的标题,可以匹配它们来对视频进行分类。

同时,作者也识别出了相似的关键字,如“总共”和“完全”、“核心”和“腹肌”,将它们归在一组。

此外,哥移民部门表示,目前哥伦比亚尚无关闭陆路边境口岸的决定,但鉴于多个邻国均已出现新冠肺炎疫情,政府提醒边境地区民众如出现呼吸疾病症状需佩戴口罩。

成对相关( pairwise correlations)是常用的方法,但当出现多个特征(多于一对)时,可能会同时存在共线性。

30 分钟——我将在 30 分钟内完成整个训练; 锻炼手臂和臀肌——我将致力于手臂和臀肌,专注于力量; 燃烧 310 卡路里——我会燃烧相当多的卡路里。

据阿拉丁指数统计,从春节假期开始,日榜排名第一名的小游戏一直是烧脑解谜类产品《我不是猪头》,同样属于烧脑类的《解救小宝》和《脑洞2020》也名列小游戏排行榜前十,《星星爆爆乐》和《眼力达人》等消除类、益智类小游戏也表现出众。在微信小游戏里,棋牌游戏表现十分亮眼,日活跃用户数、用户时长、留存等数据都远超平时。

但请注意!播放量呈偏态分布。播放量中值是27,641次,而最高的视频达到130万。这种不平衡会给模型的解释性带来问题。

“湖北地区作特殊安排。”肖远企说,湖北地区的还本付息延长安排,从中小微企业扩大到所有企业。同时,鼓励银行机构对湖北地区受疫情影响的企业在融资成本方面给予更大的优惠,配备专项信贷规模,在考核上适当倾斜。

YouTube 标题的标记和词干

可能很多80后对于“小游戏”并不陌生,上大学在校内网的偷菜,在QQ空间抢车位,这类游戏都可以称之为“小游戏”。百度百科对于“小游戏”有着自己的解释:“相对于体积庞大的单机游戏及网络游戏而言的,泛指所有体积较小、玩法简单的游戏,通常这类游戏以休闲益智类为主,有单机版有网页版,在网页上嵌入的多为FLASH格式。”

通过这种方式,作者使用预测模型来找到播放量最高的25%的视频的特征组合。

为k折交叉验证准备这些特征。

df_videos 有 8 个特征来描述每个视频细节,包括:标题、多久前发布的、视频长度、播放量、地址、卡路里、发布具体日期、发布至今的天数。

很多人不解,小游戏零门槛并不收费,但其背后的商业模式该如何维持?北青报记者为此采访国内知名营销公司鲲鹏金翅CEO徐鹏,他直言:“一方面小游戏能增加用户的微信使用时间,微信官方大力推广,增加除了社交之外的功能性;另一方面小游戏最大的功能能拉动微信广告多样性。”

27日,国务院联防联控机制举行新闻发布会,相关部门负责人围绕以上社会热点议题,回答中外媒体提问。

掌握以上关键信息是预先的准备,接下来还有六个步骤:观察数据、用自然语言处理技术对视频进行分类、选择特征、创建目标、构建决策树、阅读决策树。接下来就和雷锋网一起看看作者究竟是怎么一步一步展开研究的。

2月26日,中小企业复工率为32.8%,比23日提高了3.2个百分点。值得一提的是,制造业中小企业在大企业产业链的带动下,复工率提高较快。2月26日的复工率达到43.1%,比23日提高6.2个百分点。

num_same_area,过去 30 天内发布的针对同一区域的视频(包括当前视频)数量。例如,特征= 6,说明除了当前视频针对上半身时,过去 30 天中还有 5 个上身健身视频。 num_same_workout ,该特征类似 num_same_area,只是统计的是健身类型。例如,特征= 3,说明除了当前视频 HIIT 健身,在过去 30 天内还有 2 个 HIIT 健身视频。 last_same_area,距离上一个针对同一块身体部位视频过去的天数。例如,该特征= 10,说明针对腹肌的上一个视频,发布在 10 天前。 last_same_workout,同 last_same_area,只是针对健身类型。 num_unique_areas,过去 30 天内锻炼了几块不同的身体部位。 num _ unique _workouts,过去30天发布的不同健身类型视频的数量。

“对中小微企业提供适度优惠支持,可激发实体经济主体活力,有利于促进经济高质量发展,有利于促进金融可持续发展,畅通经济金融良性循环。”中国人民银行副行长刘国强表示,下一步,稳健的货币政策要更加灵活适度,把支持实体经济恢复发展放到更加突出的位置。在用好已有金融支持政策的同时,适时出台新的政策措施。

num_same_area特征,统计的是在过去30天内发布的针对于同一部位视频(包括当前视频)的数量。area_ful代表全身锻炼,这是Sydney视频中最常见的类型。因此,当num_same_area很大时,那么这些视频就是针对全身的锻炼。

35岁以上爱“棋牌类小游戏”

针对中小微企业复工复产面临的资金压力,相关部门已出台一系列金融举措。中国人民银行保持流动性合理充裕,运用结构性货币政策工具等,精准支持抗击疫情的中小微企业。银保监会引导金融机构加大对民营和小微企业支持的力度,保持贷款合理增速。

记者发现,游点好玩在微信平台上做的就是“共享用户量”的模式,将一款游戏产品的用户通过游戏过程扩展到其他游戏或广告平台上,让一个用户玩多款的游戏,通过实践这样的用户导出效率比较高。“共享用户量”能降低游戏厂商的扩客成本,增大了系列游戏的粉丝基数。这种新模式对很多传统游戏公司来说可以称之为不能理解的行为,将好不容易进来的用户再导出去太难了,就是因为微信小游戏都在微信强大闭环下完成这样的“零跳转”。

步骤 2:用 NLP 对视频进行分类

工信部数据确认了这一点:截至目前,全国2万多家省级“专精特新”的中小企业复工率已经达到了53.6%;工信部公告的第一批248家专精特新“小巨人”企业复工率已经达到了91.4%。

针对中小微企业面临的还本付息压力,银保监会首席风险官肖远企表示,对受疫情影响的中小微企业从1月25日到6月30日的到期贷款,鼓励银行机构给予临时性延期偿还安排,支持展期和续贷。

作者试图研究每个目标特征及其与自变量的关系。当然本文不会列举整个过程,将举两个例子。

细心的人发现,面对疫情冲击,部分传统劳动密集型中小企业受的影响比较大,而一些“专精特新”的中小企业抗风险能力相对较强,复工复产速度也比较快。

当然整个过程中也难免存在一些被错误分类的视频,作者也在转向时间特征前进行了手动修复,这里不再赘述。

与此同时,工信部将会同财政部3年内拿出100亿元支持200个实体开发区打造创新创业特色载体,助力劳动密集型中小企业与供应链上下游企业融通创新。

基于高频词列表,作者创建了 3 个关键字列表,可用于接下来环节对视频进行分类。

金融举措精准有力 缓解复工复产资金压力

除了关键词,作者还需要标记和提取标题词干。这些过程可为进一步匹配关键字和标题列表做准备。

使用其中一个特征作为目标,其余特征作为自变量,来训练预测模型。

is _ { } _区域,识别视频是否包含特定身体部位; is_ { } _健身,确定健身类型; title_contains_{},查看标题是否包含其他关键词。

接下来就是有趣的部分了,他们将从这个数据中集中提取特征,并研究是哪些因素影响着播放量。

这些标题中有 538 个不同的单词,以下列出了使用频率最高的标记/单词。可以发现,频繁使用的就是那几个词,这也再次证明博主确实喜欢起标准格式的视频标题。

对于小游戏人气的爆发,能否在收益上取得成功?叶玮坦言:“疫情期间,整个广告投放市场都不太好,投放广告的广告主也少,所以在收入端虽然有点增长,但幅度不大,尤其在微信小游戏的平台上,一来微信本身的广告规模体量就不是很大,广点通(广告渠道)的广告比穿山甲(广告渠道)效果要差一些,二来微信是去中心化的平台,游戏买量导量的成本比头条、vivo、OPPO等平台更高。”

该学者指出,尽管目前研究显示在亚裔和白人、男人和女人、年龄在60岁以上和以下患者的比较上,ACE2表达都没有明确的差异,唯独是在亚洲族裔吸烟者ACE2表达明显高于亚裔不吸烟者。她认为,新冠肺炎在中国患者中的性别差异表现,可能与中国男性吸烟率较女性高有关。

免费娱乐的背后是广告收益

此外,他们注意到数据有重叠,因为博主曾经多次上传同一个视频,在接下来的分析中将会忽略这部分不大的样本。

值得注意的是,此前社交媒体上还曾出现“吸烟能预防新冠病毒感染”、“吸烟者病毒感染率远低于非烟民”等谣言。对此,世界卫生组织曾特意发文辟谣,称没有证据显示服用维生素C、吸烟、服用草药茶、戴多层口罩、自行服用抗生素等能起到防治新型冠状病毒感染的作用,有的甚至会对身体造成伤害。

因此,作者创建了特征views_quartile,以它作为目标。

“这也充分说明了掌握关键核心技术和能力是广大中小企业应对疫情冲击、实现转型发展的制胜法宝。”张克俭说,下一步,工信部将会同有关部门尽最大努力帮助广大中小企业解决迫在眉睫的现金流不足等问题,并引导他们在持续经营下去的同时,也有机会走上“专精特新”道路,实现转型升级。

需要说明的是,博主偶尔会发布与健身无关的视频,播放数差距很大,所以作者未将这些列入分析。另外他们也过滤掉了前 30 天的视频,因为它们缺乏足够的历史数据。

这些特征有助于确定视频中应包含的身体部位或锻炼类型的最佳数量。

length和 calories之间存在正相关,但这种强度还不足以将它们直接归到一块。因为40-45分钟的视频消耗的热量与30-35分钟、50-55分钟,甚至与60多分钟的视频,都有重叠部分。因此,两个特征都保留。

2020年春节微信小游戏的人群画像,叶玮直言:“棋牌类小游戏的主要人群为35岁以上的用户,拓展渠道更多是以家庭群为主,微信群让熟人营销成为可能性,另一些竞猜类小游戏年龄画像为13-25岁,这类小游戏用户数据相比平时大增50%,整体收入比平时上涨了大约30%。”

刘国强表示,将加大对中小银行补充资本方面的政策支持,提升银行整体信贷投放能力。择机实施2019年普惠金融定向降准动态考核,释放长期流动性。继续推进贷款市场报价利率(LPR)改革,3月起我国存量浮动利率贷款定价基准进行转换的原计划不变,以便引导整体市场利率和贷款利率继续下行。

有了上述基于关键词的特征,作者已经发现受欢迎视频的类型。但这是否意味着博主应该一直发相同类型的视频?

最后,他们创建了三种不同类型的虚拟特征(dummy features):

从各省份看,中小企业复工率均稳步提升,多数每日升幅在1个百分点左右。目前有7个省份中小企业复工率超过40%。

将数据导入到 Python 中是在最后一节中完成的,以下是数据集 df_videos,一共有 837 个视频。

body_keywords(正文—关键词)——这标识了视频针对的身体部位,如“完整”身体、“腹肌”、“腿”。 workout_type_keywords(健身—类型关键字)——区分锻炼类型,如“有氧”、“伸展”、“力量”。 其他关键字——这包括常用但难以归类的关键词,如“训练营”、“精疲力竭”、“纤体”(toning)。

根据判断,选择一组关键特征来测试共线性。

有了第一个吃螃蟹的人,才会有游戏行业营销模式更多的可能性,能够使小游戏成为爆款的核心就是由简入繁的过程拿捏到位,让更多用户愿意留在小游戏中,整个行业才会有更多的可能性。除了微信,小游戏能否拓展到今日头条、抖音、快手等更多平台?让我们拭目以待。

藏在微信中的小游戏上线后一直不温不火,受到疫情影响,在2020年的春节却在疯狂圈粉。一款叫做“微乐麻将”的棋牌类小游戏成为不少家庭用户解闷的首选。对于棋牌类游戏的整体特点,资深游戏策划师叶玮接受北京青年报记者采访时直言:“每年春节,棋牌游戏都会迎来阶段性增长,但在短暂的假期过后又会迅速回落,而在平时,棋牌游戏的用户群都比较固定,尤其在地方棋牌游戏这一领域,靠地推和代理获客的模式导致产品竞争十分激烈。”

“中小企业稳则就业稳、经济稳。”工业和信息化部副部长张克俭说,随着一系列帮扶政策落地实施,中小企业复工率稳步提高。

文/本报记者 王磊 摄影/本报记者 杨小嘉

他们将视频分为两类——高播放视频(“high”)和低播放视频(“low”)。“high”占总播放量的75%,也就是播放数35578及以上的视频,剩下的都归到“low”。

步骤 5:构建决策树

3月11日,美国加州学者Hua Cai发出通讯文章指出,一项使用单细胞测序的研究发现,ACE2的表达在亚洲男性中更为主要,这可能是亚洲患者中男性新冠肺炎患病率高于女性的原因。据悉,新型冠状病毒正是通过刺突糖蛋白(S蛋白)与宿主细胞血管紧张素转化酶2(ACE2)结合,从而入侵细胞,引起组织损伤。

受新冠肺炎疫情影响,从2020年春节开始,很多人都宅在家,这样就激发了游戏行业的快速发展,除了大众关注的网络游戏和手机游戏之外,“藏在微信”中的“微信小游戏”再度回归大众视野,几年前微信小游戏的第一次亮相让大众沉迷一款叫“跳一跳”的游戏,如今已发展成各类版本,有纸牌类、有竞技类,五花八门,“特殊的春节”让小游戏活跃度激增,这会是微信小游戏的“第二春”吗?

什么是多重共线性检验,维基百科的解释是,多重共线性(也称共线性)是一种现象,其中多元回归模型中的一个预测变量可以以相当高的准确度从其他预测变量中线性预测。多重共线性不会降低模型整体的预测能力或可靠性,至少在样本数据集中是如此;它只影响单个预测因子的计算。

这种关系不难理解。 

加大帮扶力度 引导中小企业转型升级抵御风险

南都记者了解到,除了这位美国学者Hua Cai,近日来自英国诺丁汉大学呼吸系统疾病专家吉斯利・詹金斯也指出,吸烟者患上新冠病毒的风险比非吸烟者高,此外吸烟比例和疾病严重程度或许也存在联系。

在前期3000亿元专项再贷款支持下,截至2月25日,已有1008家重点保供企业获得了贷款,财政贴息后的企业实际融资成本平均为1.28%,低于国务院不超过1.60%的要求。截至2月26日,银行机构为抗击疫情提供的信贷支持已超过9535亿元。多家银行机构对湖北省内的普惠型小微企业贷款利率在原有基础上下调了0.5个百分点。

这些特征将帮助了解观众是喜欢相同的还是不同类型的视频。

Sydney Cummings  的标题都有一定套路,比如最近一个标题是《30 分钟手臂和强壮臀肌锻炼!燃烧 310 卡路里!》,通常涵盖时间、身体部位、消耗的卡路里以及其他关于锻炼的描述性词汇。观众点击这段视频之前,就会知道几个信息:

据南都此前报道,当地时间3月3日,武汉大学人民医院研究团队在SSRN平台发表《柳叶刀》预印本论文也指出,在对该院6013例确诊病例的分析发现,新冠病毒“偏爱”男性,且男性在感染病毒后遭受的伤害普遍更大。

首先,标记化视频的标题。此过程使用分隔符(如空格(” “)将标题文本字符串拆分为不同的标记(单词)。这样,计算机程序就可以更好地理解文本。

当前,新冠肺炎疫情防控形势积极向好的态势正在拓展,经济社会发展加快恢复。作为数量最大、最具活力的企业群体,我国中小微企业复工复产情况如何?个体工商户迎来哪些扶持政策?金融政策怎样精准发力?

其实有很多不同的方法来抓取 YouTube 数据。由于这只是个一次性项目,所以作者选择了一个只需要手工操作,不依赖额外工具的简单方法。

作者使用了自然语言工具包(NLTK),Python 中一个常用的开源 NLP 库,来处理标题。

中小微企业和个体工商户,对于我国经济社会意味着什么?一组数据或许可以作答:第四次全国经济普查的数据显示,截至2018年末,我国中小企业法人单位1807万家,占全部规模企业法人单位的99.8%。目前,我国登记在册的个体工商户8331.3万户,带动就业人口超2亿人。

接下来,作者遍历每个特征,并使用其他特征拟合一个模型来预测它,他们用了一个简单的梯度提升模型(Gradient Boosting Model ,GBM)和K折验证,并且根据目标特征是数字的还是分类的,应用不同的模型和分数(模型预测能力评估指标)。

据世界卫生组织最新数据显示,中国男性吸烟比例为52.1%,女性则为2.7%。然而,Hua Cai在文章中同时指出,目前暂没有强有力的证据能够证明亚洲男性吸烟率与新冠肺炎患病率或严重程度之间的关联,也无法得出确切结论。“随着来自世界各地不同种族和遗传背景的更多病例的发现,可以更好地对新冠病毒在性别上差异表现的原因进行分析”。

为了回答这个问题,他们还创建了一些基于时间序列的特征:

研究得分和每个目标特征的重要自变量。

复工复产率超过30% 仍面临不少实际困难

因此,作者使用了一种更复杂的方法——k折交叉验证( K-fold cross-validation)来达到目的。

虽然广告收益一般,但小游戏并不影响创作者的热情,游戏营销专家张雅告诉记者:“对于小游戏的变现能力我们正在进行拓展,除了卖广告之外,还希望通过小游戏把把用户导向更精准的游戏和电商等,促使他们去消费,从而产生更大的商业价值。因为小游戏的客户年龄层较为固定,能够通过营销打通娱乐和购物的端口,寻求更大的商机。”

作者选择了对于YouTube视频播放量至关重要的特征,同时还添加了三个由随机数组成的特征:rand0,rand1, rand2。当比较特征之间的关系时,它们充当anchor。如果一个特征与这些随机特征相比不太重要或不太相似时,那么它就不是目标特征的重要自变量。

准备好了一切工作,我们根据目标views_quartile建立一个决策树模型啦!

对于每个目标,他们打印出K折验证分数(平均分)和最重要的5个自变量。

在这一步中,他们根据标题中的关键词对视频进行分类。

假设博主只在周一发布力量训练,而且她的视频在周一的播放量总是更高。那么分析播放量时,应该归因它们发布在周一,还是因为它们是力量训练呢?为了获得真实的答案,作者必须确保特征之间没有强共线性。

国家市场监督管理总局副局长唐军介绍,我国已在社保、税收、房租等方面对个体工商户出台具体扶持举措。对个体工商户而言,房租是笔不小的支出。他说,各地要制定减免政策,特别是对于租用行政事业单位和国有企业房屋场所的个体工商户。在加大对个体工商户的服务力度方面,2020年上半年,对受疫情影响无力足额缴纳电、气费用的个体工商户,实行“欠费不停供”措施。

经过头脑风暴,他们选择了两种特征——基于关键词和基于时间。

这个视频针对的是身体哪个部位? 这个视频的目的是增肌还是减肥? 或者还有什么其他关键词?

几位部门负责人都提到,有关支持中小企业和个体工商户发展的举措,在一定程度上解决了一些问题,但中小企业和个体工商户抗风险能力较弱,受疫情影响的程度更深,仍然面临不少实际困难。

最后同样重要的是,作者创建了一个特征:calories_per_min(每分钟卡路里数)看看卡路里的燃烧速度。毕竟,观众都想要一些明确的(可量化的)锻炼目标。

按照 body_keywords 和 workout_type_keywords 分类,一个视频中有许多关键词。所以在匹配之前,作者还创建了 2 个特征:area 区域和 workout_type 健身类型。这些特征将一个视频的所有身体部位和锻炼类型连接成一个字符串。

你可能还记得,这个研究的目标是增加YouTube的播放量。是不是说明,我们可以直接拿播放量作为目标呢?

他表示,将充分发挥工信部认定的657家国家中小企业公共服务示范平台、329家国家小型微型企业创业创新示范基地以及4000多家省级平台和2000多家省级基地的作用,为企业转型升级提供服务及场所。