手机免费拿“惠购机”政策变“分期贷款”

(原标题:手机免费拿?眨眼就算授权 小心“购机惠”成分期贷)

“手机免费拿”“信用购机”……近年来,一些电信营业厅里出现了大量的“购机惠”政策,买手机时只要对着营业员的手机眨个眼进行身份认证,就可以得到几百到几千元不等的优惠。

自开发皎漂项目以来,中方团队坚持深耕当地市场,充分发挥全产业链优势,根据缅甸国别特点和项目进展要求,全面组织项目尽职调查、可行性研究、环境影响评价、投资架构设计、风险研究防控等多项前期工作。同时,通过与缅甸电力与能源部开展多轮对话谈判,为项目开发争取有利的技术商务条件,双方最终就《购电协议》文本达成一致,并顺利完成了一系列审批。中国驻缅甸大使陈海希望该项目能建设成为两国在电力领域合作的示范项目。他表示,缅甸电力发展相对缓慢,电力和基础设施投资建设在缅甸有很大发展空间。

展望未来,中缅合作在中国—东盟合作大步迈上新台阶的形势下,不仅将更有活力,还将对地区经济均衡发展产生正面“溢出效应”,对各方携手构建人类命运共同体具有极强的示范意义。

发展“人头”还有奖励

陈音江建议,有关部门应进一步加大监管力度,一旦发现损害消费者权益的违法违规行为,不仅要责成经营者退还费用和赔偿损失,还要依法对其进行处罚。此外,消费者也要不断提高自我保护意识,以免上当受骗。

由缅甸NIHC与MCM公司联合投资、山东电力建设第三工程有限公司总承包的曼德勒地区皎喜燃气电站是缅甸为尽早解决电力短缺问题公开招标的快速电站项目。该项目已于2019年5月份竣工投产,装机容量达145兆瓦,每年可产出12.74亿千瓦时清洁电力,一举解决当地270万人的用电难题。

论文的理论和实验结果强调了置信学习的实用性,例如识别 ImageNet 和 CIFAR 中的许多标签问题,并通过在清洗过的数据集上进行训练来提高标准 ResNet 的性能。置信学习促使人们需要进一步了解数据集标签中的不确定性估计、清洗训练集和测试集的方法以及识别数据集中本体论问题和标签问题的方法。

为了了解 CL 是如何工作的,让我们假设我们有一个包含狗、狐狸和牛的图像的数据集。CL 通过估计噪声标签和真标签的联合分布(下图右侧的 Q 矩阵)来工作。

该名客服起初与营业员回答的如出一辙:“缴纳话费即可、对个人毫无影响。”

专程出席电站竣工典礼的缅甸国务资政昂山素季表示:“皎喜电站大大增加了曼德勒地区的电力供给,还通过国家电网为其他地区提供电力,我对皎喜电站克服困难如期投产表示欣慰与赞赏。”为实现2030年全国电力全覆盖目标,缅甸政府制定了各种电力开发方案,包括发展水电、燃气发电、风电、太阳能发电等。作为缅甸电力行业最大外资来源国,中方在电站建设、输电配电、技术转让和培训等领域同缅方开展了全方位合作。

在上图中,每种方法的直线上的每个点,从左到右,描述了训练的准确性,去除了 20%、40%…、100% 的估计标签错误。黑色虚线用所有例子描述了训练时的准确性。当移除少于 100k 个训练示例时,使用 CL 在清洗过的 ImageNet 训练集上训练(不添加合成噪声),观察 ResNet 验证精度的提高。当超过 100k 个训练实例被移除时,观察使用 CL 相对于随机移除的改善,如红色虚线所示。

那么到底什么是橙分期?对用户有没有影响?未告知客户贷款性质便办理业务,是否合规?电信客服表示,该业务不在客服处理范围之内,需要记者拨打“翼支付”客服电话进行咨询。

小萨对此一头雾水,因为她从来没办理过这项业务。后经查询得知,原来是她在去年1月,到电信柜台办理“碎屏险退费”业务时,“被办理”了这笔叫“橙分期”的业务。

近年来,缅甸经济增长速度保持在6%至7%之间,油气工业是经济发展的重要基础和支撑。作为共建“一带一路”在缅甸的先导示范项目,中缅油气管道在缅甸南部、北部和中部共4个场站的分输点,已成为缅甸境内重要的能源动脉和能源基础设施。截至2019年11月30日,中缅油气管道分别累计向中国输送原油2485.75万吨、天然气242.33亿立方米,累计为缅甸带来直接经济收益5.2亿美元。缅甸前副总统吴年吞认为,中缅油气管道是互惠共赢项目,将提高缅甸的经济、工业化和电气化水平,有助缅甸经济实现长远发展。该项目缅甸员工普遍认为,中方十分重视属地人才培养,不断提升当地员工在管理、专业技术等岗位的比例,为缅甸能源工业培养了不少人才。

中国法学会消法研究会副秘书长陈音江认为,这种“诱导式办理流程”,侵犯了消费者知情权。

与大多数机器学习方法不同,置信学习不需要超参数。我们使用交叉验证从样本中获得预测概率。置信学习还有许多其他优点:

难道“热情”的电信营业员办理的直降800元手机优惠是一笔贷款吗?

置信学习是如何工作的?

稀疏性(Q 中零的分数)概括了这样一个概念,即现实世界中的数据集,如 ImageNet,有一些类不太可能被错误地标记为其他类,例如 p(tiger,oscilloscope) ~ 0 in Q。如上表中突出显示的单元格所示,与 Mixup、MentorNet、SCE-loss 和 Co-Teaching 等最新方法相比,CL 显著增强了对稀疏性的鲁棒性。这种鲁棒性来自于直接建模 Q,即噪声和真实标签的联合分布。

在添加标签噪声的 CIFAR 中标签噪声的良好表征

在高噪音和高稀疏的情况下,平均来说,CL 提高了 10% 以上高噪声学习水平和 30% 以上的高稀疏学习水平。

记者随后致电“翼支付”人工客服,对方又为记者转接到专业处理“橙分期”业务的客服人员。

CL 是在处理噪音标签的文献中制定的原则之上建立起来的:

新年伊始,中国和缅甸很快将以高规格启动两国建交70周年系列庆祝活动。令人欣喜的是,“一带一路”倡议提出以来,中缅深化全方位合作的基础越来越牢、动力越来越足、成果越来越多。

雷锋网版权文章,。详情见转载须知。

营业员为记者办理这项业务期间,自始至终未提及消费贷。她只是承诺道,“原价1099元的手机,只要交99元就能拿到手,但每月必须交129元的话费。”

剪枝以搜索标签错误。例如,通过损失重加权使用软剪枝,以避免迭代重标记的收敛陷阱。 对干净数据进行统计训练,避免在不完全预测概率的情况下重新加权损失(Natarajan et al.,2017),从而避免学习模型权重中的错误传播。 对训练期间使用的示例进行排序,以允许使用不规范概率或 SVM 决策边界距离进行学习。

当记者追问“这项业务是不是消费贷款时?”这名客服承认了这项业务的实质:电信利用自己庞大的用户基数,在用户办理橙分期业务对镜头眨眼的同时,实际是在授权电信以用户名义,办理一笔甜橙金融贷款。用户交话费其实就是还本金,而贷款所产生的利息,则由电信美其名曰“红包返现”,由翼支付直接代扣。

注意:虽然这简化了本文中使用的方法,但抓住了本质。

莱比塘铜矿是“一带一路”又一个标志性示范项目。该项目位于缅甸西北部实皆省蒙育瓦地区,是亚洲最大湿法炼铜项目之一,2019年阴极铜产量达到12万吨,纳税额位居在缅外资企业前列。特别是项目区内及周边社区的地表水、地下水、空气、噪声、土壤等处于持续监测状态,并随着生产设施的完善逐步增加新的监测点,力求最大程度降低对环境的影响。缅甸前选举委员会主席丁埃评价说:“莱比塘铜矿实现了‘五方共赢’,包括中方企业、缅方合作伙伴、缅甸政府、周边社区、公司员工都从项目获得了长期稳定的收益,对缅甸国家经济发展、民众生活水平的提高有着深远意义。”

2019年11月5日,中国电建海投公司与缅甸电力公司正式签订皎漂燃气电站项目《购电协议》。该项目位于缅甸西部若开邦的皎漂镇,采用燃气—蒸汽联合循环技术,建成后年上网供电量约10亿千瓦时,将显著改善皎漂及周边地区电力供应,有力拉动地方经济。缅甸电力与能源部部长吴温楷称赞中方建设者在缅甸电力项目中所展现出的专业能力,并欢迎广大中资企业参与到缅甸基础设施建设当中。

我们鼓励阅读论文原文来理解公式中的符号,这里的中心思想是,当一个例子的预测概率大于每个类的阈值时,我们自信地认为这个例子实际上属于该阈值的类。每个类的阈值是该类中示例的平均预测概率。这种阈值形式将 PU 学习中众所周知的鲁棒性结果(Elkan&Noto,2008)推广到多类弱监督。

“商家在消费者不知情或不充分知情的情况下,只强调优惠,不提风险,诱导其购买存在较高风险的金融产品,明显涉嫌侵犯消费者的知情权、选择权和公平交易权,消法对此有明确的规定。”陈音江表示,因此无论是电信运营商,还是橙分期经营者,都应事先告知消费者安全注意事项、限制权利条款等,然后再让消费者自主决定是否购买。

多标签图像(蓝色):在图像中有多个标签 本体论问题(绿色):包括“是”或 “有”两种关系,在这些情况下,数据集应该包含其中一类 标签错误(红色):数据集别的类的标签比给定的类标签更适合于某个示例

雷锋网(公众号:雷锋网)雷锋网雷锋网

你可能对它的数学过程比较好奇,好吧,这个计数过程采用的是下面的公式:

CL 基于噪声数据剪枝的原理,通过计数对噪声进行评估,并对实例进行排序以进行置信训练。在这里,我们在 Angluin 和 Laird 分类噪声的假设基础上,将 CL 泛化到直接估计给定噪声标签和无噪声标签之间的联合分布。

ImageNet 本体论问题中类命名问题的自动发现

使用置信学习,我们可以使用任何合适的模型在任何数据集中找到标签错误。下面是常见数据集中的其他三个实际示例。

左:置信计数示例,这是一个不正常的联合估计;右:有三类数据的数据集的噪声标签和真标签的联合分布示例

出于弱监督的目的,CL 包括三个步骤:

正常情况下,只要电信按照约定返还红包,就不会出现逾期。但只要手机欠费,就会暂停发放红包。这也就是为什么办理该项业务后,用户不交话费,会“上传征信”或者“被催贷”。

2019年9月,小萨收到一条催债短信,被告知“已经逾期四天,翼支付合约机欠款50.08元,近期将上传逾期信息至中国人民银行征信系统”。

有关 CL 算法、理论和证明的全部内容,请阅读这篇论文。这里,我总结一下论文的主要观点。

办理期间,记者就收到了提示分期还款的短信。经过多次询问,这位营业员答复称,“你不用管这些短信,你只要交你的话费就可以了。”

无独有偶,从未办理过贷款业务的张女士也经历了“被催贷”。2018年8月底,张女士到电信营业厅买手机。营业员称,只要办理每月99元话费的电信套餐(含三张无限流量卡),买手机就可以直降800元。

张女士查询发现,橙分期是某金融科技公司与中国电信合作推出的分期消费模式,为电信用户提供0元购机、话费还款的分期服务。

CL 通过直接估计标签噪声的联合分布,自动发现数据集中类的本体论问题。在上表中,我们显示了在我们估计单类数据集 ImageNet 的标签噪声联合分布时最大的偏离对角线。每行都列出了噪声标签、真标签、图像 id、计数和联合概率。因为这些是非对角的,所以噪声类和真类必须是不同的,但是在第 7 行中,我们看到 ImageNet 实际上有两个不同的类,它们都被称为 maillot。

样本外预测概率(矩阵大小:类的样本数) 噪声标签(矢量长度:示例数)

张女士没有犹豫就办理了业务,售价为999元的手机,她只花了199元。然而,接下来的日子,只要忘交话费,张女士就会经历“爆炸催款”。催款电话和短信中屡次提到如不缴费将“影响征信”。

cleanlab 是一个带有标签错误的机器学习和深度学习框架,和 PyTorch 类似。在 cleanlab 文档中了解更多信息。

上图显示了使用置信学习发现的 2012 ILSVRC ImageNet 训练集中的标签错误的例子。为了便于解释,我们将使用 CL 在 ImageNet 中发现的标签问题分为三类:

使用标签噪声的联合分布查找标签问题

电力基建合作已成为中缅共建“一带一路”尤其是中缅经济走廊的重要内容,双方还在多个领域取得了联动发展、造福民众的新成果。

置信学习(CL)已成为监督学习和弱监督的一个子领域,可以被用于:

“优惠购机”活动到底存在哪些法律风险?消费者又该如何做好自我保护?

中南财经政法大学数字经济研究院执行院长盘和林分析称,橙分期从穿透性监管来看,冻结24个月花呗额度,且是翼支付分期,逾期违约金较高,这些都符合网贷特征。

杭州市民陈女士也反映,除“送手机”外,在办理电信业务时,营业员还以送电视、电动自行车、手表、流量以及帮缴物业管理费等名义,在她不知情的情况下,办理了分期贷款。

——发展“人头”有奖励。记者调查发现,如果消费者对“分期”业务的安全性提出质疑,电信营业员便会“抛出”各种诱惑。作为“主打”业务,西城区这家营业厅强调,“不是人人都有这个额度,如推荐朋友来办理,还能得到红包奖励。”

朝阳区这家营业厅的员工直接表示,如果今天办理,不但不用补手机的差价,还送价值149元的无线耳机。为了表示这项业务很“靠谱”,这位营业员拿出办理该业务的名单,上面标注许多消费者已领了耳机、茶具等不同赠品。

估计给定噪声标签和潜在(未知)未损坏标签的联合分布,以充分描述类条件标签噪声 查找并删除带有标签问题的噪音示例 去除训练误差,通过估计潜在先验重新加权实例

对于已办理该项业务的消费者,虽然通过“对着镜头眨眨眼”授权,但这并不意味着运营商可以不担责。如果消费者不知情,那么根据合同法有关规定,该协议条款无效。如果有证据证明,运营商存在故意隐瞒或欺骗,消费者可以要求惩罚性赔偿。

将联合分布矩阵乘以示例数。让我们假设我们的数据集中有 100 个示例。所以,在上图中(右边的 Q 矩阵),有 10 个标记为 dog 的图像实际上是狐狸的图像。 将 10 张标记为 dog 的图片标记为标签问题,其中属于 fox 类的可能性最大。 对矩阵中的所有非对角项重复此操作。

记者调查发现,“被办理”橙分期业务的消费者越来越多。自2019年1月到9月底,多名电信客户发帖称,自己在办理电信业务时,遇到了此类问题。有相当一部分消费者,因不知道这笔分期贷款的存在,结果出现逾期记录。

上图显示了 CIFAR 中标签噪声联合分布的 CL 估计,标签噪声增加了 40%。观察(b)中的 CL 估计与(a)中的真实分布有多接近,以及(c)中矩阵中每个项的绝对差的低误差。概率被放大 100 倍。

2019年6月,张女士到营业厅要求注销账号,却被营业员告知,必须交满当时优惠的800元,还有违约金1000多元。张女士无奈地交了近2000元后,才最终销户。

有这么好的事儿吗?记者在北京、杭州等地走访多家电信营业厅发现,一些营业员在消费者不知情的情况下,存在私自为客户办理分期贷款业务的现象。

——隐瞒贷款实质。“如果店员没有向您推荐直降1000活动,您可拨打17718501310举报获得100元奖励。”2019年9月25日,北京市西城区一家电信营业厅的宣传海报十分醒目。

描述标签噪声 查找标签错误 学习噪声标签 发现本体论问题

记者致电中国电信客服得知,其营业厅分为官方营业厅与合作代理营业厅。客服承认,合作代理营业厅有些并不是电信“正式员工”。而向记者推销橙分期业务的,正是合作代理营业厅的工作人员。

从上图可以看出,CL 需要两个输入:

理论上,论文给出了 CL(定理 2:一般的逐例稳健性)准确地发现标签错误并一致地估计噪声和真实标签的联合分布的现实条件。我们的条件允许每个例子和每个类的预测概率中有错误出现。

2012 年 ILSVRC ImageNet 训练集中通过置信学习确定的前 32 个标签问题。标签错误用红色框表示,绿色表示本体论问题,蓝色表示多标签图像

随着经济发展提速,缅甸用电需求快速增长,每年新增需求300兆瓦至500兆瓦,基础设施落后与经济发展提速之间的矛盾日益突出。值得欣慰的是,像皎漂电站这样的深化互联互通合作的早期成果,近年来正不断涌现。

上表显示了 CIFAR-10 上带噪声标签的多类学习的 CL 与最新方法的比较。在高稀疏性(见下一段)和 40%、70% 的标签噪声的情况下,CL 的表现优于 Google 表现最好的 MentorNet、Co-Teaching 和 Facebook 研究院的 Mix-up,性能超过它们 30%。在使用置信学习之前,对这一基准的改进要小得多(大约只有几个百分点)。

在北京市朝阳区一家电信营业厅,记者也遇到了相同情况。一名营业员表示,“橙分期”就是一个业务名称,但闭口不提贷款实质。

从上图右侧的矩阵中,估计标签问题:

直接估计噪声和真标签的联合分布 适用于多类数据集 查找标签错误(错误按最有可能到最不可能的顺序排列) 是非迭代的(在 ImageNet 中查找训练标签错误需要 3 分钟) 在理论上是合理的(现实条件下准确地找到标签误差和联合分布的一致估计) 不假设标签噪声是随机均匀的(在实践中通常行不通) 只需要预测概率和噪声标签(可以使用任何模型) 不需要任何真实(保证不损坏)的标签 自然扩展到多标签数据集 作为 cleanlab Python 包,它是免费、开源的,用于描述、查找和学习标签错误

在 Amazon 评论中存在的标签错误的例子,使用置信学习来识别不同的数据模式和模型

——营业厅还有“两张面孔”,消费者维权难。记者调查时还发现一奇怪现象,有的营业厅热情推销橙分期业务,有的营业厅则表现“淡定”。

“即使电信按期自动扣款,如消费者账户资金短缺,无论金额大小,都很容易对其征信造成影响。”他还表示,橙分期的违约惩罚措施,分为违约金和滞纳金两部分,违约金是银行贷款基准利率的四倍。很明显,这项业务并不像营业员所描述的那样“万无一失”。

——用“优惠”包装“贷款”。这项业务是电信业务吗?记者向电信客服致电咨询,对方首先肯定了该业务属于电信。当记者询问这项业务是否具有贷款性质,客服回答“是”。

继续我们的示例,CL 统计 100 个标记为 dog 的图像,这些图像很可能属于 dog 类,如上图左侧的 C 矩阵所示。CL 还统计了 56 幅高概率标记为 fox 的图像和 32 幅高概率标记为 cow 的图像。

他认为,运营商在开展业务时,要在显著位置公示公布所有收费业务及标准,以显著方式提请消费者注意有关收费标准、安全注意事项和风险警示等,确保每笔收费业务都真正做到全面、准确告知,充分保障消费者的知情权、选择权和公平交易权。

“优惠购机”到底是怎样一种销售套路?记者随机选择了数十家电信营业厅进行体验。

带噪标签与不带噪标签置信联合与估计联合分布的置信学习过程及实例,其中,y~ 表示观察到的噪声标签,y* 表示潜在的未损坏标签

——如不按期缴费,将影响征信。用“购机惠”进行包装的橙分期,到底是不是网贷?办理之后会对用户产生什么影响?