时间:2016年4月21~23日
地点: 北京·国际会议中心
购票电话:010-64738142

专题: 支撑互联网服务的高可用架构

Day of week:

探究典型的互联网服务的高可用架构之道

专题出品人:
贺岩(尤达)
蚂蚁金服资深专家

贺岩(花名尤达)蚂蚁金服资深专家

蚂蚁金服高可用架构组负责人,蚂蚁高可用护航小组负责人,蚂蚁历年双11大促技术负责人。

曾经参与过历代应用和技术架构变迁,参与很多和系统建设,辗转过很多业务团队,对全站系统都有一定的深入了解。

后转型为全站架构师做跨团队的技术架构改进工作,主导过全站性能优化,余额宝/快的架构优化,支付宝金融核心去O,容灾等项目。

目前主要致力于蚂蚁金服技术风险管控工作,主要负责下一代高可用方向架构升级。

业务时间除了技术还喜欢模型和油画。技术方面对高可用,云计算,成本优化,大数据等方面话题比较感兴趣。


by 郭斯杰
Twitter Staff Software Engineer

Twitter从原来的Kestrel,Kafka等多套不同的Messaging架构,演变成基于DistributedLog/Bookkeeper的统一的Messaging架构,从而服务不同负载特性的用户场景。架构演进背后都有哪些思考和经验呢?作为DistributedLog/Bookkeeper项目的主要负责人,郭斯杰将分享一手的架构思路。


by 刘浩(庄辛)
蚂蚁金服应用架构师

容量和容灾等问题在各个微观层面上都影响着蚂蚁金服各项业务的飞速发展。 通过“异地多活“技术,将蚂蚁金服各业务的核心应用链条封装在一个 IDC 单元、在不同地域部署多个这样的单元。 这一方面能够保障在未来 3~5 年的业务峰值处理能力,另一方面实现异地的容灾能力全面降低核心业务的技术风险。

“异地多活”相对传统“两地三中心”架构,有2个核心区别和挑战:

  1. 异地多活,物理距离带来的延迟:随着互联网金融业务的快速增长,单城市的容量已不能满足业务发展的需求。物理距离在 1000 公里以上的异地部署,基本能实现全国部署的能力。以 1500 公里为例,一次网络往返耗时在 0.03 秒左右,整个业务链路上如果有多次异地访问的话,业务耗时将明显增加,导致影响系统性能和容量,从而影响用户体验。
  2. “两地三中心”架构的容灾缺陷:“两地三中心”的容灾设施,无日常业务运行,其可用性是无法得到连续保障的。同时随着互联网金融业务的快速增长,容灾设施的大量成本投资的利用率较低。

本次演讲将包括:

  1. ...

by 董健
北京博晓通科技有限公司联合创始人&CTO

任何有点规模的应用,都无法回避分布式架构,任何分布式架构都没有一招制敌的法宝,路由、负载均衡、调度、并行计算、资源竞争、高可用、高可靠、可伸缩、高性能,这些要素一个也不能少,而每个要素又包含了多种设计选择,每种设计方法都会有妥协、有争取,最终这些选择的组合才能构成一个完整的、有针对性的分布式应用。

听众受益:

  1. 系统性的了解到大数据中分布式架构的最核心内容和设计方法。
  2. 在理论的基础上,分析分布式架构中的多种设计选择。
  3. 明白分布式架构中没有一招制胜的法宝,所以要去了解到什么才是一个完整、有针对性的分布式应用。

by 张亮
当当架构专家

当当经历了 16 年的发展,技术架构已完成从 .net 向 java 的转型。整体架构基于 ddframe,按技术组件划分为分布式通信框架、分布式定时任务框架、数据分片中间层、分布式事务管理和分布式数据管理平台等。

ddframe 的组成部分 dubbox、elastic-job 和 sharding-jdbc 已开源,试图将完善的解决方案呈现至开源社区。

演讲包含内容:

  1. 当当业务系统概览,阐述互联网电商的核心问题以及解决方案。
  2. 当当平台化技术栈介绍:
    1. 基于应用框架 ddframe 的 dubbox、elastic-job、sharding-jdbc 等分布式组件说明。
    2. 去中心平台化思路分享。
  3. 当当开源理念及经验分享。

by 陈斌
易宝集团 CTO

在移动互联网飞速发展的今天,移动互联网系统面临着高可用性和高度可扩展的挑战,如何设计一个这样的系统架构是一门艺术。解决高可用性问题的关键是如何合理地细分系统的服务,并对其对其运行环境进行有效的隔离,确保一个服务的失效不会影响到生产系统中其他正在运行的的服务。这类似在奥林匹克游泳馆里设置的泳道,通过一个个的浮标连线,确保一个选手游泳时飞溅的水花不影响临近的其他选手的高水平发挥。与此同时,为海量用户提供满意的支付交易服务,需要解决系统的可扩展性问题。这不仅仅是简单地填加机器、扩大存储、增加带宽(X 轴扩展)所能完成的,更需要在架构设计的过程中,通过对服务的合理组合和拆分(Y 轴),以及对用户/地域的有效分组(Z 轴)来实现无障碍的系统能力扩展。

听众受益:

  1. 复杂移动互联网系统服务的容错架构设计;
  2. 大型移动互联网平台的可扩展性架构设计;
  3. 移动互联网架构设计的经验。

by 孙子荀
腾讯高级开发工程师,QQ公众号后台负责人

介绍一个系统如何从一个承载单业务的系统,演变成一个平台级的开放系统过程中如何设计重构的模块流程,通用的问题和挑战。从分布式系统理论各个方面来展现理论和实践的结合。

内容包括: 接入平面的关注点;框架和服务的选型思路;资源调度分配算法;平台系统中各个子系统的分布式容灾,容量模型。

同时还会介绍基于数据驱动闭环的系统如何与原有模块结合。

听众将会了解到:

  • 高可用的平台级架构如何应用微服务与SOA等思想;
  • 如何根据业务的关注点进行分布式容灾的设计;
  • 架构师应该有的规划建模能力。

by 林佳梁(子衿)
阿里巴巴技术专家

双 11 不仅是一场全球消费者的狂欢,也是对中国互联网技术体系的实力检验。一下子几千万人涌进来买买买,这种真实的商业场景全世界一年也只有一次。全球最大的支付平台之一, Visa,在实验室取得的测试数据是 5.6w 笔每秒;而双十一这天,支付宝在实战中达到了每秒钟 8.6 万笔,交易订单的创建量更是达到了每秒钟 14 万笔,刷新了网络交易峰值的世界纪录。 从 11 月 10 号深夜日常的交易数量陡然飙升到每秒钟 14 万笔订单,这中间经历了一个怎么样的过程?突然爆发的流量洪峰对业务链路的冲击又有多大?除此之外,线上复杂性也是惊人的,仅仅一个购买动作,就包含从关键字搜索,挑选商品,再到购物车结算,优惠抵扣,生成订单,支付宝付款等一系列的流程,涉及上百个应用,链路上的任何一个"零件"出了问题,都有可能导致交易的失败。

管控调度系统的使命,就是解决以上的问题,让系统能够从容面对流量洪峰以及复杂的线上情况。

今天我们会介绍阿里管控系统是如何保证集群稳定对外提供服务,不受突如其来的流量洪峰的冲击,同时通过自动降级下游不稳定应用,去除短板,保证链路整体的稳定性;...

演讲专题

Covering innovative topics

  • 业务核心架构

    本专题将介绍不同业务场景下,为了满足不同业务需求,系统核心架构设计上的特殊性考虑。例如,O2O业务系统架构设计上如何打通线上和线下,即时通讯业务系统架构如何实现高效消息通知,智能派单业务系统架构如何融入各种不同的算法……推荐业务,互联网金融业务,电商业务……没有实现不了的业务,只有你意想不到的架构。

  • 工程效率提升

    各公司研发体系内部会有很多工具及平台。他们和产品并没有直接的关系,但是这些工具及平台是工程师使用最多的。提高这部分的效率实际上对整个工程效率影响非常大,可以极大缩短开发的周期及人力投入。本专题致力于分享各公司在提高工程效率的各种最佳实践以及典型思路。

  • 大数据应用层层深入

    大家都知道大数据是金矿,但是,经过巧妙设计的大数据应用才是把金子挖出来的工具,缺乏合适的工具,金矿将长眠地下,不能发挥任何作用。本专题结合一线互联网公司微信,京东,LinkedIn等大数据应用,通过细致的剖析,包括场景,建模,结果应用,扩展等,全面展示了大数据应用的方法论和价值,相信对于各个行业都具有极高的借鉴意义。

  • 研发安全

    如何从研发过程的各个方面保障系统的安全

  • Java新发展

    2015 年,Java 度过了 20 岁生日。可以说 Java 是目前应用最广的语言之一。本专题将关注最新的 Java 技术和最好的 Java 实践经验。

  • 亚马逊AWS深度创新实践(厂商专场)

    从亚马逊 AWS 于2006年3月14日上线 Amazon S3 服务至今,已经过去了整整十年时间。AWS 作为云计算领域的开拓者之一,其在保障云服务的弹性、安全性、高可用性、成本可控性等方面积累了大量的实践经验与知识,同时也推动了全球云服务行业的快速发展。

    在 AWS 迎来10周年纪念之际,本专场将邀请来自 AWS 的资深技术顾问、解决方案架构师及 AWS 云服务用户,分享在 AWS 上构建个性化服务的实践过程,展示云计算相关技术的创新成果,演讲内容将覆盖深度学习、Python 开发、大数据平台架构、容器管理、物联网应用等多个技术领域。

  • 基于云的 IT 系统升级部署专场(厂商专场)

    2016年随着云计算相关技术的不断发展与实践,企业在面对云服务时必然将更加关注应用落地与解决方案的实际部署等问题。而对于开发者来说,基于云的开发可以解决一些传统开发方式解决不了的问题,但在云计算开发实践以及云平台迁移的过程当中仍需要留意一些关键的技术细节问题。

  • 容器集群管理实践专场(厂商专场)

    容器技术及Docker在经历了过去一年的不断实践、应用以及开源社区的努力推动,目前已经发展得愈发成熟、稳定。然而当企业在进行大规模容器调度、编排、管理以及Docker部署应用、各种管理工具的使用结合时,仍然会面临着一些困难和挑战需要解决。

  • 支撑互联网服务的高可用架构

    探究典型的互联网服务的高可用架构之道

  • 云平台架构

    云计算的概念已经发展了多年,无论是公有云还是私有云均已得到广泛运用,近年来以Docker为代表的容器技术更是极大的推动了云平台技术的发展。本专题将探讨在多种不同的应用场景下,云平台的架构该如何设计,云平台的服务该如何管理,业内多家公司将分享他们的实战经验。

  • 架构演进之路
  • 大数据平台架构

    大数据平台层出不穷,如何选型和架构

  • 从机器学习到人工智能

    在大数据时代,这些技术如何影响我们的生活

  • 自动化运维

    运维事故频频出现,运维人员应该如何避免

  • 未来的前端

    前端的变化日新月异。从早期脚本库、jQuery,到百花齐放框架,再到近年 AngularJS 和 React;手工打包、合并 Sprite 到工具自动化;单人作战到团队协作的工程化开发;传输协议上从 HTTP 1.1 到 HTTP 2;从简单页面到越来越多的复杂富应用。这次专题,我们希望能面向未来,一起思考、探索与实践。

  • 移动开发挑战

    移动互联网日益深入生活,背后有哪些值得挖掘的技术实践

  • 人才与团队
  • 复杂环境下美丽说&蘑菇街电商的升级之道(限额免费体验专场)

    蘑菇街 CEO 陈琪说,简单地只做媒体把时尚内容摆在用户面前的时代正在成为过去,能够引导用户消费的社交电商正在袭来。在这个机遇与挑战并存的时代,电商平台亟需找到新的用户兴趣点,更加快速地响应用户需求,不断提升用户体验品质。从技术层面来看,电商平台在应对业务挑战时,仍然需要不断提高技术支撑力,比如怎样在电商促销活动逐日增多的情况下,对系统的设计、研发等各方面进行升级换代?在全民移动化的趋势不容忽视的情况下,如何能保障移动端全链路的问题实时跟踪实时解决?转型到社会化电商之后,如何根据业务环境寻找到合适的算法模型?这些都将是本期美丽说&蘑菇街专场活动将要分享的重点内容。

  • 大数据生态构建专场(厂商专场)

    业界流传一句话:三分技术,七分数据,得数据者得天下。

  • 打破规则,我是黑客

    「这个世界有规则,不过是用来打破的。」对于黑客来说,证明自己存在最直接的方式就是打破已有规则,在网络空间中进入上帝模式,俯视目标的运行规律。黑客是有争议的存在,但是谁能没争议?守正出奇且具备创造力,在争议中进化世界。本专题将把黑客文化浓厚的「KCon 黑客大会」诸多精彩带上 QCon 大舞台。

  • 产品设计思维

    互联网产品层出不穷,那些成功的产品背后有哪些思路可以借鉴

  • 移动测试技术

    

移动互联网快速发展阶段下,移动端的自动化测试、专项性能优化测试(crash、内存泄露、流量、耗电、卡顿/流畅度、弱网络、I/O等等)、动静态测试、移动众测等多个领域都有很多不同于PC时代的困难和挑战,也都有其领域独特的优势和机会。以移动领域的最佳测试技术实践方案为切入点,本专题希望给大家更多的思路方向和视野。

  • 服务化与微服务架构

    越来越多的公司开始尝试使用微服务架构(Microservices Architecture)构建围绕业务、细粒度的分布式系统。微服务的优势显而易见,不过在其带来灵活性、扩展性和可伸缩性的同时,也面临着诸多挑战,譬如服务拆分、服务治理、测试、自动化部署以及监控告警等。本专题邀请国内一线互联网公司的技术专家,分享其使用微服务的实践以及思路。

  • 编程语言实战

    新的编程语言不断涌现,旧有语言也有很多新的发展。不同语言又有很多类似或者迥异的机制实现某些共有的概念,如异步,如并发。本专题中,你将看到不同语言如何实现并发和异步,Lua 语言的新应用,以及 Rust 语言之特性。

  • 知名互联网公司的管理方法

    知名互联网公司的管理方法

  • 技术创业

    技术人要创业,有哪些因素要考虑,有哪些坑要面对

  • 新时代的数据存储与访问技术
  • 运维与监控专场(厂商专场)

    有人认为运维的过程更像是消防,7*24小时响应异常和危情。但实际情况是,无论做什么运维,最基本的职责都是保证业务能够稳定运行。运维以技术为基础,通过技术保障产品来提供更高质量的服务。当然,运维技术也包括服务监控技术,对服务运行的状态进行实时的监控;对基础设施性能分析;对App和API进行性能监控;发现服务隐患等等。本专场就邀请了好雨云CTO张斌、逸创云客服CEO叶翔、云智慧VP刘志达,和听云研发总监杨金全共同来讲讲各自在产品运维方面,在为客户提供性能优化服务方面克服了哪些难关,在技术选型上有哪些值得借鉴的经验。

  • 新兴技术及应用
  • 移动开发与即时通讯专场(厂商专场)

    移动之火,人尽皆知!移动端设备性能和功能的不断提升,直接促进了移动领域的发展,进而,移动App开发平台和第三方服务机构如雨后春笋般出现。在此前提下,用户对高效、稳定、可靠的即时消息推送服务的需求亦在不断增加,这些服务所提供的开放平台标准接口,自助集成语音、短信、即时通信能力也是提升用户体验的重点。