好文分享 第4期

  • 数据人的“大考”:AnalyticDB如何强力支撑双11?
    每年的双11都是云原生数据仓库AnalyticDB MySQL版(原分析型数据库MySQL版)的一块试金石。今年AnalyticDB除了在阿里数字经济体内进入更多核心交易链路,全力支撑双11以外,AnalyticDB全面拥抱云原生,构建极致弹性,大幅降低成本,释放技术红利,重磅发布了诸多全新企业级特性,让用户及时拥有极高性价比的云原生数据仓库。本文深度解析云原生数据仓库AnalyticDB面临的挑战和最新关键技术,分享双11护航背后的技术实践与经验。
  • 干货 | 携程Elasticsearch数据同步实践
    Elasticsearch是最近几年非常热门的分布式搜索和数据分析引擎,携程内部不仅使用ES实现了大规模的日志平台,也广泛使用ES实现了各个业务场景的搜索、推荐等功能。本文聚焦在业务搜索的场景分享了我们在做数据同步方面的思考和实践,希望能对大家有所启发。

  • 京东到家MySQL容器化,为何首选Docker而非K8S?
    本文根据詹乡泉老师在〖deeplus直播第250期〗线上分享演讲内容整理而成。(文末有获取本期PPT&回放的方式,不要错过),分享视频:https://youtu.be/skZlLhqDUdc

  • Elasticsearch 技术分析(九):全文搜索引擎Elasticsearch,这篇文章给讲透了!
    本篇主要是基于之前的博文的一个总结,希望通过这篇文章能让读者大致了解Elasticsearch是做什么的以及它的使用和基本原理。

  • ClickHouse集群搭建(一)

  • ClickHouse集群搭建(二)
    ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。

  • 双引导系统下的 VeraCrypt 配置
    对于笔记本电脑这种时常会携带外出的电子设备,基本的安全考量是必不可少的,而应用全盘加密(Full Disk Encryption)便是其中一个避免个人资料泄漏的重要措施。本文将简述如何在 Win Linux 双引导系统下使用 VeraCrypt 的配置技巧。

  • AIOps在美团的探索与实践——故障发现篇
    美团技术团队在行业、业务领域知识和运维领域的知识等方面有着长期的积累,已经沉淀出不少工具和产品,实现了自动化运维,同时在AIOps方面也有一些初步的成果。我们希望通过在AIOps上持续投入、迭代和钻研,将之前积累的行业、业务和运维领域的知识应用到AIOps中,从而能让AIOps为业务研发、产品和运营团队赋能,提高整个公司的生产效率。

  • 基于chaosblade的故障注入平台实践
    当今社会互联网应用越来越广泛,用户量日益剧增。在人们对互联网服务的依赖性增大的同时,也对服务的可用性和体验感有了更高的要求。那么如何保障服务在运营过程中能一直给用户提供稳定的、不间断的、可靠可信的服务呢?例如一个金融产品,如果出现过一次问题,那可能带来巨大的损失。大家都知道金融产品的系统架构和服务逻辑是相当复杂的,至此大家都会第一时间联想到测试工程师,他们会通过单元测试、集成测试、性能测试等来验证服务的稳定性。但尽管如此,也是远远不够的,因为错误可以在任何时间以任何形式发生,尤其是对分布式系统。所以这里就需要引入混沌工程(Chaos Engineering)。

  • 对话任务中的“语言-视觉”信息融合研究
    目标导向的视觉对话是“视觉-语言”交叉领域中一个较新的任务,它要求机器能通过多轮对话完成视觉相关的特定目标。该任务兼具研究意义与应用价值。日前,北京邮电大学王小捷教授团队与美团AI平台NLP中心团队合作,在目标导向的视觉对话任务上的研究论文《Answer-Driven Visual State Estimator for Goal-Oriented Visual Dialogue-commentCZ》被国际多媒体领域顶级会议ACMMM 2020录用。

  • 美团无人车引擎在仿真中的实践
    过去几年,自动驾驶技术有了飞速发展。国内也出现了许多自动驾驶创业企业,这些公司以百度开源项目Apollo为起点,大都可以直接进行公开道路测试,公开道路测试也成为促进技术进步的主要方法。基础问题得以解决之后,行业面临的更多是长尾问题,依靠路测驱动自动驾驶能力建设的方式变得不再高效,离线仿真的地位日益凸显。行业头部企业在仿真的投入十分巨大,Waymo公司2019年公布的仿真里程是100亿英里,是路测里程的1000倍。相应地,美团无人车团队在仿真上的投入也在逐渐增大。在仿真平台的建设中,团队发现公开道路测试和仿真测试看似相似,实际上差异巨大:在车载环境下,为了确保系统的稳定运行,通常要保证一定资源处于空闲状态;仿真环境则不同,如何高效利用资源,如何实现压榨资源的同时确保仿真结果与路测结果一致成为了关键目标。在应对这些挑战的过程中,美团提出了无人车引擎的概念,将车载与离线环境的差异隔离起来:功能模块无需任何更改便可以满足两种场景的需要。

  • TensorFlow Serving 模型更新毛刺的完全优化实践
    在点击率CTR(Click Through Rate)预估算法的推荐场景中使用 Tensorflow Serving热更新较大模型时会出现短暂的延时毛刺,导致业务侧超时,降低算法效果,为了解决这个问题,爱奇艺深度学习平台团队经过多个阶段的优化实践,最后对 TF Serving 和 Tensorflow 的源码进行深入优化,将模型热更新时的毛刺现象解决,本文将分享Tensorflow Serving的优化细节,希望对大家有帮助。

  • 日志异常检测初步实践与探索
    日志的主要目的是记录系统(包括服务和业务等)状态和重要的事件帮助定位系统的问题。日志对于理解系统状态和定位性能问题至关重要。因此,日志是在线监控和异常检测的一个重要信息源。在很多业务和服务的故障自愈过程中,日志异常检测与根因分析是必不可少的一环。但是之前我们通常都使用人工的方式来定位问题,主要包括人工检测与分析和人工学习错误日志提取正则表达式来进行故障定位这两种方式。

  • CIKM 2020 | 一文详解美团6篇精选论文
    AI平台/搜索与NLP部/NLP中心/知识图谱组共有六篇论文(其中4篇长文,2篇短文)被国际会议CIKM2020接收,这些论文是知识图谱组在多模态知识图谱、MT-BERT、Graph Embedding和图谱可解释性等方向上的技术沉淀和应用。

  • HDFS慢节点监控及处理
    HDFS集群随着使用时间的增长,难免会出现一些“性能退化”的节点,主要表现为磁盘读写变慢、网络传输变慢,我们统称这些节点为慢节点。当集群扩大到一定规模,比如上千个节点的集群,慢节点通常是不容易被发现的。大多数时候,慢节点都藏匿于众多健康节点中,只有在客户端频繁访问这些有问题的节点,发现读写变慢了,才会被感知到。

  • 基于 TiSpark 的海量数据批量处理技术
    熟悉 TiSpark 的人都知道,TiSpark 是 Spark 的一个插件,它其实就是给予了 Spark 能够去访问 TiDB 底层分布式存储引擎 TiKV 或者 TiFlash 的能力。之前我们一直在解决读的问题,写问题并没有付出太多的时间去解决。今天就给大家揭秘,我们是怎样使用 TiSpark 去实现海量数据批处理,然后写入到 TiDB 里面去的。

  • 双汇大数据方案选型:从棘手的InfluxDB+Redis到毫秒级查询的TDengine
    双汇发展多个分厂的能源管控大数据系统主要采用两种技术栈:InfluxDB/Redis和Kafka/Redis/HBase/Flink,对于中小型研发团队来讲,无论是系统搭建,还是实施运维都非常棘手。经过对InfluxDB/Redis和TDengine大数据平台的功能和性能对比测试,最终将TDengine作为实施方案。

  • Apache Arrow:一种适合异构大数据系统的内存列存数据格式标准
    本文介绍一种内存列存数据格式:Apache Arrow,它有一个非常大的愿景:提供内存数据分析 (in-memory analytics) 的开发平台,让数据在异构大数据系统间移动、处理地更快。同时,比较特别的是这个项目的启动形式与其他项目也不相同,Arrow 项目的草台班子由 5 个 Apache Members、6 个 PMC Chairs 和一些其它项目的 PMC 及 committer 构成,他们直接找到 ASF 董事会,征得同意后直接以顶级 Apache 项目身份启动。

  • Apache Kylin的实践与优化
    Apache Kylin是一个基于Hadoop大数据平台打造的开源OLAP引擎,它采用了多维立方体预计算技术,利用空间换时间的方法,将查询速度提升至亚秒级别,极大地提高了数据分析的效率,并带来了便捷、灵活的查询功能。