新闻资讯

  • RFID如何为Perry Ellis的客户运营提供动力——从库存计划到结账
    正如零售行业在过去三年多中了解到的那样,维持一个强大的供应链风险很高。零售商需要确保购物者始终可以在他们想要的地方买到他们心仪的产品,否则他们可能会失去忠诚度。Perry Ellis 正在通过与 Mojix 合作推出RFID技术来应对这一挑战,该技术将帮助零售商从门店层面一直到更广泛的库存计划来管理其供应链。大约 95% 的 Perry Ellis 产品在离开生产工厂之前都贴上了 RFID 标签。先进的RFID功能已在40家门店实施,零售商正在向全球连锁店推广。由于试点门店的面积很小,因而该技术很快便发挥了作用。据悉,在1,500到3,000平方英尺之间,库存需要在前台和后厅之间仔细分类,每家商店都需要清楚地了解库存,以确保客户不会因缺货而失望。Perry Ellis信息系统副总裁Sandeep Baghel在接受Retail TouchPoints采访时表示,在销售任何产品时,我们与商店平台的内置集成使用RFID系统来告诉我们库存中有什么,这样它就知道它有没有丢失。此外,RFID的使用将帮助Perry Ellis更好且更细致地了解哪些产品在哪些商店销售。知道某个 SKU 是某个位置的畅销商品是一回事,但了解推动这些销售的确切尺寸和颜色可以将销售提升到一个新的水平。Baghel表示,如果你纯粹看纯粹的实物库存,我们没有太大的差异 - 不到2%,但如果你看一下尺寸,就会发现差异很大。这意味着我们在门店失去了机会,因为我们没有合适的规模,而补货是由企业对系统的客观感觉来驱动的。如果我们的商店因任何原因弄乱了尺码,我们将无法正确修复,从而导致无法正确销售。按照计划,一旦所有40家商店都部署了所有硬件和软件,我们将把我们的公司库存与RFID显示的任何内容同步,以便规划团队拥有准确的库存数据,来更好地做出决策。拥有带有 RFID 标签的物品还可以随时提高出货效率,并随时为客户提供出色的消费体验。传统的例子是,将RFID绑定到员工的手机上,让他们有效地找到合适的尺寸、颜色或其他选项,以减少客户等待的时间。但是,RFID也可用于消除整个消费体验中可能发生的摩擦事故,例如排队结账。Baghel说,使用传统方法,一次只能扫描一个条形码,而部署RFID后,如果有人买了10件商品,我只需在他们面前挥舞RFID读写器,就可以同时扫描所有物品,这是一种生产力的提高。虽然RFID技术过去一直令人诟病价格昂贵,但Baghel认为,随着采用率的增长,它将变得实惠——这是很有必要的。RFID的正确使用,无论是在店内还是在整个供应链上,都将为未来几年的客户期望设定标准。Baghel表示,近年来RFID成本一直在下降,因此零售商使用它变得越来越合理,沃尔玛和塔吉特这样的大型零售商都在使用RFID,同时他们还要求供应商也使用RFID标签。随着数量的增加,使用这些RFID标签的成本也会逐渐下降。这也意味着对于任何其他零售商来说,了解准确的库存及其位置非常重要。我相信,通过RFID投资,潜力是无限的。

    2023/04/07

  • 谷歌Bard将接入更大规模大语言模型:先要确保控制好AI
    谷歌对聊天机器人Bard进行了升级。当地时间3月31日,谷歌及其母公司Alphabet的CEO桑达尔皮查伊(Sundar Pichai)在一档播客节目中透露,Bard将接入参数规模更大的大型语言模型PaLM,其数学和逻辑方面的能力将有所提高。Bard此前的运行基础是轻量版语言模型LaMDA,谷歌去年曾透露,LaMDA具有1370亿参数。最新公布的PaLM包含5400亿参数,数量几乎是前者的4倍。相比之下,OpenAI的模型GPT-3具有1750亿参数,曾被称为参数数量最多的大型语言模型,该公司最新款多模态模型GPT-4的参数规模有所升级,但该公司并未透露具体数字。随着参数数量增加、规模变大,皮查伊表示,PaLM在推理和编码等方面展现出更强的能力,可以提供更加丰富的数据和更多元化的内容。谷歌Bard的产品经理Jack Krawczyk也在一条推文中分享,接入PaLM后,Bard在数学和逻辑方面的能力有所提高,“希望用户有机会测试新版本。”在博客中,皮查伊还解释了为何没有让Bard先接入更强大的PaLM。他表示,LaMDA的规模较小,能够以较低的算力运作,更加适合让更多用户使用和测试,并进行反溃目前生成式AI(人工智能)领域的角逐中,谷歌始终落后于竞争对手,不过皮查伊并未表示担忧,他认为公司的步伐较慢,是因为他们“不希望在确保能很好地控制AI之前”就接入功能更强大的语言模型。他形容谷歌的进度仍处于非常早期的阶段,但随着时间推移,他们将会逐渐接入更强大的模型,“比起抢速度,我们更希望把事情做对做好。”AI技术的快速发展逐渐引起外界的担忧。当地时间3月31日,意大利个人数据保护局宣布,从即日起禁止使用聊天机器人ChatGPT,限制其开发公司OpenAI处理意大利用户信息,并开始立案调查。就在上周,特斯拉CEO埃隆马斯克(Elon Musk) 及数名AI领域企业家、学者和高管也发表公开信,呼吁全球暂停继续开发GPT技术至少6个月。皮查伊同样认为目前AI的发展速度过快,可能会对社会构成威胁。提及上述公开信时,他表示“有人表达担忧很重要,我认为这值得关注......(如何控制技术)需要大量的讨论和辩论,没人知道所有答案,也没有一家公司能做对。”“AI是一个非常重要的领域,需要对其进行监管”。但皮查伊建议,最好采用现有行业中已有的法规进行管控,例如隐私法规和医疗保健法规,而不是重新制定专门针对AI的新法律。此外,还有不少人担忧AI技术将在未来取代人类的工作,皮查伊认为,人类需要去适应AI所带来的影响。新技术会帮助人类提高工作效率,例如在未来编程将会变得更加简单,这也会提高人们的创造力。目前,Bard并未被嵌入搜索引擎中,而是作为独立的页面存在,谷歌强调它是“搜索的补充体验(complementary experience)”,该聊天机器人目前仅对英美地区部分用户开放访问权限。

    2023/04/05

  • 大数据工具变迁简史:人的需求,略大于算法的疆域
     近年来,人们频频「遭遇」各类大数据工具,体验到许多前所未有的变化。不管是惊喜还是惊吓,数据工具都在加速整个社会的数字化转型,面对这样的趋势,加深我们对数据工具的认识和理解将越来越重要。 本文对大数据工具的变迁作了阶段性总结,并对未来数据产品的新方向进行探讨。通过当下可识别的坐标,铭刻十年前的历史引爆点,呈现数据生态链的环环相扣,也看见大数据工具不只是一套封闭的技术体系,人与数据产品互缘同构,它的一头接入算法的革新脉络,另一头与人的生产生活有机相连,持续回应更新的现实、观念和技术,并不断衍生出新的形态支撑各个行业的运转。 不过,无论解题工具(数据工具)多好,解题思路(算法)多棒,最终我们还是要一遍遍回到最原始的价值拷问我们解题是为了什么?我们还将探讨工具大众化、跨云互通、架构融合和数据安全等数据产品的新方向。 自1946年计算机发明以来,我们经历了软件、互联网、移动互联网到现在万物可联的时代。计算机也从最初的辅助「计算」功能,到现在成为我们承载信息的重要「伴侣」。个人的社交、购物、旅行等生活内容,企业的设计、生产、经营和管理都以数据的形式被记录着。 这些变化,在近十余年,尤其是移动互联网(PC时代计算机还只是触达了少部分人)让普通人的信息被计算机记录开始,令大家感受尤其明显。这背后同时也是一段数据工具的变迁史。 01 历史引爆点与萌芽期 在互联网出现之前,软件还主要服务于企业,过程中诞生了如Oracle、SAP、IBM等为企业提供信息化的软件公司。在漫长的时期中,软件承载着数据记录、计算和管理能力,数据库也以Oracle、IBM等公司的产品服务于数据管理需求为主。 在后期,随着企业经营决策复杂性的提升,利用数据分析进行决策的需求逐渐被提出,出现了Teradata等数据仓库产品,Oracle、IBM等传统数据库企业也都纷纷推出自己的解决方案。这几十年的时间里,大家更多讲的是软件而非数据。甚至到PC互联网时期,真正接触和使用计算机的人依然有限。 2010年左右,智能手机的出现,移动互联网的爆发,实现「人联」,才真正开启了数据时代。也是在这前后,数据量的爆发式增长带来了数据工具的爆发。▲ 2010年左右是数据工具爆发的奇点 2010年左右数据工具大爆发,数据平台架构百花齐放。 2010年之前传统数仓还是以处理信息化系统中的结构化数据为主。2010年,为了应对移动互联网中出现的大量用户行为日志等非结构化数据,以Hadoop为代表的大数据平台在此背景下诞生,揭开了大数据工具的序幕。并于随后几年出现了一大批围绕着Hadoop生态的大数据产品。 Hadoop批量处理能力强,但实时性差,难以满足应用系统对用户提供更加实时服务的需求,此时Spark、Flink等流式处理平台横空出世。批流数据并行的Lambda、Kappa等架构逐渐成为主流。 随着Hadoop的非实时性缺陷越来越让人难以忍受、硬件成本的持续下降和云计算的渗透,MPP架构的数仓再次回到人们的视野,尤其是Snowflake以云数仓的方式刷新了大家对传统数仓的认知,国内新的数仓解决方案也如雨后春笋般出现。 然而,数据平台架构演进的步伐并没有因此停止,数据湖、湖仓一体等架构在最近两年又被大家提出和应用。 事实上,百花齐放的数据平台架构背后是数据和应用复杂度的提升,优秀的产品永远致力于把功能做到极致,突破自身产品能力的边界;而优秀的用户永远在寻找适合自己的架构设计和产品组合,用户和产品就这样并行推动数据工具的发展。在这过程中也诞生了大量优秀的数据产品企业,如Splunk、Datapicks、Snowflake、Clickhouse等。▲ 数据平台架构的变迁 数据工具是一个生态链。 以上更多是从横向看整个数据架构的变迁,但纵向来看,任何一个数据架构都并不是孤立的,而是需要一整套数据处理的工具链才能完成数据处理的闭环,包括采集传输、查询处理、数据转换和分析、输出等多个环节。虽然数据流的顺序可能不完全一样,但模块基本一致。生态产品的诞生也和前面架构设计的多样性、应用的多样性息息相关。 我们看到另外一个比较主流的创业方向便是兼容于各种数据工具和应用系统的生态工具,如做数据采集的Fivetran、管道传输的Kafka和建模转换引擎dbt。▲数据处理的典型环节 资料来源:a16z.com 数据产品众多,架构选型成为关键。 经过十余年的发展,受益于开源、国内外互联网大企业的引领和创业公司不断创新,数据工具也是层出不穷,每一个数据处理环节都有大量可选工具。 工具没有绝对优劣,而用工具的人至关重要,如何搭建适合业务需求的工具组合才是用户需要重点关心的问题。▲数据处理的各个环节工具众多 02 需求和算法驱动数据产品滚滚向前 现在我们拥有众多大数据的工具,但工具背后本身诞生的背景是什么,为什么会有如此多的工具? 这最终还是要回归到方法和价值上:我们处理的思路有什么革新?为什么要处理各种各样的数据,以及处理这些数据能带来多大的价值? 解题思路,算法驱动。 我们首先来看看人们处理数据的思路有多大的变化。「思路」在计算机领域换个词就叫「算法」,而「算法工程师」这个岗位大体是伴随着数据科学和人工智能诞生的。 在软件时代,算法更多停留在传统统计方法的应用:排序、求和、求统计值等,其最典型的应用在BI产品中,用于轻量级企业内部数据洞察。 在互联网时代,信息量的爆炸给统计机器学习带来新的机会,包括经典的逻辑回归、SVM、KNN等分类、聚类算法在搜索、推荐引擎中被大量使用。 同样是在2010年,AlexNet在ImageNet中图像识别的优异表现揭开了深度神经网络的序幕,大量的神经网络模型、算法被提出,不仅仅应用在图像领域,同样应用在语音、文本等非结构化数据中。而深度神经网络对数据的依赖达到了前所未有的高峰,数据甚至成为了AI的第一生产要素,这又对数据处理工具提出了更高的要求。 近年来,AI逐渐走入大模型时代,拥有高算力、大数据量的互联网企业训练了超大规模参数的通用AI模型,尤其是在文本和内容生成领域。这再一次推动了数据使用的新模式,对大模型使用者的数据要求从大而全走向细而精。▲算法发展史 无论你的解题工具(数据工具)多好,解题思路(算法)多棒,最终我们都要回答一个最原始的价值问题:我们解题是为了什么?有什么作用? 解题目的,价值驱动。 在软件时代,数据聚合的目的更多是为了企业内部进行经营决策,所以BI是数据最早的出口形态。到了移动互联网时代,各种数据被互联网企业收集,进行用户洞察分析,提升搜索引擎、电商甚至信息流图文、视频的推荐准确率,提高用户点击率,数据价值崭露头角。 随着机器学习和神经网络的发展,人们发现数据可以被利用的思路和方法被进一步打开,更多非结构化数据、半结构化数据和最原始的结构化数据被收集,开始用于广泛的商业场景: 产品的研发迭代 互联网企业是利用用户数据迭代产品的最大受益者。数据辅助产品设计不仅仅可以在互联网、软件开发领域,在其他行业领域也可以被应用服装设计中通过收集用户购买行为来进行款式设计,餐饮口味选品可以通过收集用户点评数据来辅助决策。 数据助力营销 其实最早的BI很重要的一个应用场景就是被用于营销洞察,但彼时缺乏足够的外部数据支撑。随着近年来电商的崛起和线上购物渗透率的快速提升,企业对外部消费者的洞察也越来越精确,精准的数据营销也成为数据应用的典型场景。 数据助力企业管理 传统的企业管理更多关注流程管控,缺乏精细化的资源管理和决策依据。在数据时代,员工的表现、企业的生产、销售都进一步被数据化,企业管理者拥有更多的维度洞察整个企业的人事和过程的管理。 数据助力人机协作 目前我们看到的数据应用大部分还是围绕着「人」的数据。随着「物联」越来越普及,机器和设备的数据也被大幅收集,人们可以更加了解机器,人机协作也变得越来越高效和精准。▲数据应用发展史 目前数据在很多行业还处于渗透期,大家更多关注营销,但并没有更深入地推进到产品研发、企业经营管理和人机协作领域。随着数据在金融、电信、工业、政务、医疗教育甚至农业等行业应用,个人和企业将被深度数据化,行为和决策受数据驱动,执行过程被数据记录,劳动成果被数据化衡量,甚至整个社会的运转都是由数据在背后驱动,这将对数据工具提出新的需求。 03 数据产品发展方向:大众化、跨云、架构融合和安全 数据产品的诞生从源头来看是需求的驱动,从路径上看需要IT基础设施的助力,包括算法的迭代、硬件性能提升及成本下降,企业IT架构的调整。需求和技术的相互促进将带来更多创新机会。 工具大众化 人类生产工具的最终目的是提升生产效率。让复杂的工作变得更简单,让机器去负担最复杂的那部分运算逻辑,让人关注工作中更具创造性的部分。 上面所列的绝大多数数据处理工具都有较高的技术门槛和使用门槛,但企业最终使用数据的是决策者、运营人员和业务人员。他们并不具备高超的IT技能,这就无形中增加了企业使用数据过程中的沟通成本。所以,未来数据工具大众化也一定是大家追求的目标。国外不少产品用Excel的形态来方便业务人员使用数据,降低工具使用的门槛。虽然这种形态无法发挥大数据工具的所有能力,但在用户体验上还是更进了一步。 大众化UI(交互界面)的形态并没有局限,但如何保证易用性才是问题的关键。也只有产品更加大众化,才能进一步扫清数据工具持续提升渗透率和用户基数的障碍。▲Sigma产品用Excel Spreadsheet的形态方便用户使用数据 产品跨云平台能力 公有云厂商向来是底层技术实力比较强的企业,其数据类产品当然也并不落下风。Snowflake能在AWS生态繁荣发展的前提也是使用AWS的S3来存储。而AWS在数据产品中从提取传输、存储、数据处理到消费都有对应的云产品。 如果公有云客户的第一选择还是考虑云厂商第一方产品,那第三方产品是不是就完全没有机会了呢?▲AWS全套数据产品链 即使放眼全球,多云和混合云架构也是企业的主流选择。这就给大量独立的数据工具提供了广阔的生存空间。跨云数据产品也将成为未来企业需要考虑的重点。无论是公有云还是非公有云,数据产品能兼容于各类异构云/云原生基础设施,将成为用户采用的前提。▲全球92%的企业都有多云战略 产品架构融合能力 以往我们进行软件架构设计的时候,硬件成本是重要的考量因素:如何节约内存?如何降低CPU消耗?如何平衡IO吞吐和读写性能?随着摩尔定律的深入和后摩尔定律时代的到来,硬件复杂度提高,能力越来越强,硬件的单位成本也随之下降。▲4Gb和8Gb DRAM 价格过去5年呈下降趋势资料来源:MacroMicro 这时候我们需要考虑如何把更多的事交给硬件去做,而软件也在扩展自身功能的边界。以近年来较受关注的概念HTAP(混合事务型和分析型数据库)为例,传统AP(分析型数据库)更关注吞吐、TP(交易型数据库)更关注实时读写,但随着硬件IO能力的提升,大家开始探讨为什么不能有一款数据库可以同时兼容二者的能力呢?▲OLAP和OLTP数据库正在融合 除了HTAP,在数据库领域新兴的其他趋势如批流一体、湖仓一体、AI Native(算法/AI内生在数据库产品中)等等,无不体现了硬件能力提升背后软件功能的边界越来越宽的趋势。因此,数据产品应在设计之初就考虑未来产品的可扩展能力,如何逐步拓宽自己的功能边界,以获取更大的市场。 前面提到数据类产品未来将在各个行业深入渗透,但行业和行业之间对产品的要求千差万别。到底是产品本身能力扩展能够适应绝大多数行业,抑或未来出现行业版产品呢?这也是非常值得探讨的话题。 数据安全 如果不解决安全问题,数据的价值发挥将受到极大的限制。 随着数据价值的不断提升,数据安全的价值也会越来越大。不久前,工信部等16部门联合发布的《关于促进数据安全产业发展的指导意见》提出,到2025年,我国数据安全产业规模超过1500亿元,年复合增长率超过30%。要知道,2022年整个网络安全的市场规模也不超过1000亿元,而这里面还包含了70多个产品品类。晨山资本在《数安法》颁布之前就已经布局了数据安全运营、API安全、隐私计算数据安全新兴方向,也从这些企业的发展感受到市场对数据安全需求的快速提升,也就不难理解政策部门对2025年数据安全规模的乐观预期了。 回头来看,大数据工具的变迁历史不过短短十余年,不过天下难事,必作于易,天下大事也必作于细,前路还有很多可能性。2023年,期待能看到更多充满生命力的创新涌现,也希望更多数据方向的创业者来和我们一起交流探讨!

    2023/04/04

  • 3月份零售业景气指数为50.6% 企业经营信心进一步增强
    中国商业联合会发布,3月份中国零售业景气指数为50.6%,较上月上升0.3个百分点。分行业看,3月份,商品经营类指数为50.6%,较上月微升0.3个百分点;租赁经营类指数为51.8%,较上月微降0.6个百分点;电商经营类指数为49.9%,较上月小幅上升1.4个百分点。其中,商品经营类景气分指数季节性回升。销售额指数为52.8%,较上月小幅上升2.5个百分点,经营预期向好,体现了商品零售季节性规律,也表明企业经营信心进一步增强。盈利水平指数为51.0%,较上月微升0.5个百分点,表明商品经营类企业对盈利水平预期稳定。3月份,商铺出租率指数为54.3%,较上月小幅上升1.4个百分点,连续3个月上升,表明租赁经营类企业预期经营状况持续好转。继上月电商业务在线总商品数分指数回归临界点以上后,电商业务实物总销售额分指数3月也回升至临界点以上。当月电商业务实物总销售额指数为50.9%,较上月继续小幅上升1.7个百分点,重回荣枯线以上,表明电商经营类企业销售预期持续向好。中国商业联合会认为,在促消费政策等因素推动下,消费逐渐恢复常态,零售企业要积极布局一年规划,采购新品,策划促销,迎接消费稳定恢复。(记者 王 珂)

    2023/04/03

  • 胡诚林委员:人脸识别技术应用广泛,建议尽快立法规范
    全国两会即将召开。今年,全国政协委员胡诚林带来了《关于将人脸识别保护纳入国家立法计划的提案》。胡诚林在提案中写道,人脸识别技术现已成为大众身份验证、生活安全和生活便利的重要组成部分,在为人们带来便利、安全的同时,也带来了潜在的个人信息泄露和法律风险。胡诚林提到,一些信息采集者不经过公众同意就擅自采集个人信息,构成侵权。在公共场所,人脸识别设备的使用者为了减少公众同意程序的麻烦,同时人脸识别是非接触、无感识别,公众一般很难发现人脸信息被采集,人脸识别设备的使用者往往不经公众同意对他人信息进行采集,侵犯了公众的个人信息权。人脸识别技术在运用过程中容易走极端,不提供替代方案。人脸信息的保管者由于自身技术条件和管理水平良莠不齐,一些不法分子甚至用黑客工具来获取数据库里的大量个人信息,进而导致大量个人信息外泄或者引发诈骗、盗窃、侵入住宅等违法犯罪。胡诚林提到,《人脸识别数据处理条例》(以下简称《条例》)的起草,主要依据《中华人民共和国个人信息保护法》《中华人民共和国网络安全法》《中华人民共和国消费者权益保护法》《最高人民法院关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》《信息安全技术人脸识别数据安全要求》(GB/T 41819-2022)及有关法律法规。胡诚林建议,由网信、公安等部门负责牵头提出计划并尽快着手制定《人脸识别数据处理条例(草案)》,报请全国人大纳入立法审议程序,一经通过后公布实施,实现人脸识别技术推广使用的同时,切实保护公民合法权益。

    2023/04/03