请选择 进入手机版 | 继续访问电脑版

默认
打赏 发表评论 21
想开发IM:买成品怕坑?租第3方怕贵?找开源自已撸?尽量别走弯路了... 找站长给点建议
跟着源码学IM(四):拿起键盘就是干,教你徒手开发一套分布式IM系统
微信扫一扫关注!

本文由原作者“crossoverJie(陈杰)”原创分享,即时通讯网收录时有改动和修订,感谢原作者。


0、系列文章



1、本文引言


老读者应该还记得我在去年国庆节前分享过一篇《技术干货:从零开始,教你设计一个百万级的消息推送系统》,虽然我在文中有贴一些伪代码,依然有些朋友希望能直接分享一些可以运行的源码。好吧,质疑我穷我无话可说(因为是真穷。。),怀疑我撸码的能力那是绝对不行,所以这次准备拉起键盘大干一场——徒手撸套分布式IM出来!^_^!

本文记录了我开发的一款面向IM学习者的 IM系统——CIM全称:CROSS-IM),同时提供了一些组件帮助开发者构建一款属于自己可水平扩展的 IM。

通过学习本文和CIM代码,你可以获得以下知识:

  • 1)如何从头开发一套IM(CIM的客户有点弱,见谅见谅);
  • 2)如何设计分布式的IM架构;
  • 3)如何将你的分布式IM架构用代码和相关技术实现出来。

本文配套的CIM源码地址:


其它相关资料:


* 友情提示:阅读本文和CIM源码,需要您具备一定的网络编程、IM理论等知识等,如果您还不具备这些,请先阅读《新手入门一篇就够:从零开发移动端IM》,完全来的及!

2、关于作者


a.jpg

本文作者的其它文章:


3、运行演示


本次特地录了两段视频演示(群聊、私聊),点击下方链接可以查看视频版 Demo。

CIM 私聊视频演示:https://www.bilibili.com/video/av39405821
CIM 群聊视频演示:https://www.bilibili.com/video/av39405501

4、架构设计


下面来看看具体的架构设计:
1.jpg

架构说明:

  • 1)CIM 中的各个组件均采用 SpringBoot 构建;
  • 2)采用 Netty + Google Protocol Buffer 构建底层通信;
  • 3)Redis 存放各个客户端的路由信息、账号信息、在线状态等;
  • 4)Zookeeper 用于 IM-server 服务的注册与发现。

整体主要由以下模块组成:

  • 1)cim-server——IM 服务端:用于接收 client 连接、消息透传、消息推送等功能。支持集群部署;
  • 2)cim-forward-route——消息路由服务器:用于处理消息路由、消息转发、用户登录、用户下线以及一些运营工具(获取在线用户数等);
  • 3)cim-client——IM 客户端:给用户使用的消息终端,一个命令即可启动并向其他人发起通讯(群聊、私聊);同时内置了一些常用命令方便使用。

5、逻辑流程图


整体的流程也比较简单,流程图如下:
2.jpg

流程解释如下:

  • 1)客户端向 route 发起登录;
  • 2)登录成功从 Zookeeper 中选择可用 IM-server 返回给客户端,并保存登录、路由信息到 Redis;
  • 3)客户端向 IM-server 发起长连接,成功后保持心跳;
  • 4)客户端下线时通过 route 清除状态信息。

所以当我们自己部署时需要以下步骤:

  • 1)搭建基础中间件 RedisZookeeper
  • 2)部署 cim-server,这是真正的 IM 服务器,为了满足性能需求所以支持水平扩展,只需要注册到同一个 Zookeeper 即可;
  • 3)部署 cim-forward-route,这是路由服务器,所有的消息都需要经过它。由于它是无状态的,所以也可以利用 Nginx 代理提高可用性;
  • 4)cim-client 真正面向用户的客户端;启动之后会自动连接 IM 服务器便可以在控制台收发消息了。

更多使用介绍可以参考快速启动

接下来各章将重点看看具体的详细设计实现,比如群聊、私聊消息如何流转;IM 服务端负载均衡;服务如何注册发现等等

6、IM 服务端


先来看看服务端:主要是实现客户端上下线、消息下发等功能。

首先是服务启动:
3.jpg
4.jpg

由于是在 SpringBoot 中搭建的,所以在应用启动时需要启动 Netty 服务。

从 pipline 中可以看出使用了 Protobuf 的编解码(具体报文在客户端中分析,相关知识请见:《Protobuf通信协议详解:代码演示、详细原理介绍等)。

7、注册发现


需要满足 IM 服务端的水平扩展需求,所以 cim-server 是需要将自身数据发布到注册中心的。这里参考之前分享的《搞定服务注册与发现》有具体介绍。

所以在应用启动成功后需要将自身数据注册到 Zookeeper 中:
5.jpg
6.jpg

最主要的目的就是将当前应用的 ip + cim-server-port+ http-port 注册上去:
7.jpg

上图是我在演示环境中注册的两个 cim-server 实例(由于在一台服务器,所以只是端口不同)。这样在客户端(监听这个 Zookeeper 节点)就能实时的知道目前可用的服务信息。

8、登录


当客户端请求 cim-forward-route 中的登录接口(详见下文)做完业务验证(就相当于日常登录其他网站一样)之后,客户端会向服务端发起一个长连接。

如之前的流程所示:
8.jpg

这时客户端会发送一个特殊报文,表明当前是登录信息。服务端收到后就需要将该客户端的 userID 和当前 Channel 通道关系保存起来。

9.jpg
10.jpg

同时也缓存了用户的信息,也就是 userID 和 用户名。

9、离线消息


当客户端断线后也需要将刚才缓存的信息清除掉。

11.jpg

同时也需要调用 route 接口清除相关信息(具体接口看下文)。

10、IM 路由


12.jpg
从架构图中可以看出,路由层是非常重要的一环;它提供了一系列的 HTTP 服务承接了客户端和服务端。
目前主要是以下几个接口。

10.1注册接口


13.jpg
14.jpg

由于每一个客户端都是需要登录才能使用的,所以第一步自然是注册。

这里就设计的比较简单,直接利用 Redis 来存储用户信息;用户信息也只有 ID 和 userName 而已。只是为了方便查询在 Redis 中的 KV 又反过来存储了一份 VK,这样 ID 和 userName 都必须唯一。

10.2登录接口


这里的登录和 cim-server 中的登录不一样,具有业务性质:
15.jpg

具体的流程:

  • 1)登录成功之后需要判断是否是重复登录(一个用户只能运行一个客户端);
  • 2)登录成功后需要从 Zookeeper 中获取服务列表(cim-server)并根据某种算法选择一台服务返回给客户端;
  • 3)登录成功之后还需要保存路由信息,也就是当前用户分配的服务实例保存到 Redis 中。

为了实现只能一个用户登录,使用了 Redis 中的 set 来保存登录信息;利用 userID 作为 key ,重复的登录就会写入失败。

16.jpg
17.jpg

类似于 Java 中的 HashSet,只能去重保存。


获取一台可用的路由实例也比较简单:
18.jpg
  • 1)先从 Zookeeper 获取所有的服务实例做一个内部缓存;
  • 2)轮询选择一台服务器(目前只有这一种算法,后续会新增)。

当然要获取 Zookeeper 中的服务实例前自然是需要监听 cim-server 之前注册上去的那个节点。

具体代码如下:
19.jpg
20.jpg
21.jpg

也是在应用启动之后监听 Zookeeper 中的路由节点,一旦发生变化就会更新内部缓存。这里使用的是 Guava 的 cache,它基于 ConcurrentHashMap,所以可以保证清除、新增缓存的原子性。

10.3群聊接口


这是一个真正发消息的接口,实现的效果就是其中一个客户端发消息,其余所有客户端都能收到!流程肯定是客户端发送一条消息到服务端,服务端收到后在上文介绍的 SessionSocketHolder 中遍历所有 Channel(通道)然后下发消息即可。服务端是单机倒也可以,但现在是集群设计。所以所有的客户端会根据之前的轮询算法分配到不同的 cim-server 实例中。

因此就需要路由层来发挥作用了。

1.jpg
2.jpg

路由接口收到消息后首先遍历出所有的客户端和服务实例的关系。

路由关系在 Redis 中的存放如下:
3.jpg

由于 Redis 单线程的特质,当数据量大时;一旦使用 keys 匹配所有 cim-route:* 数据,会导致 Redis 不能处理其他请求。所以这里改为使用 scan 命令来遍历所有的 cim-route:*。

接着会挨个调用每个客户端所在的服务端的 HTTP 接口用于推送消息。

在 cim-server 中的实现如下:
4.jpg
5.jpg

cim-server 收到消息后会在内部缓存中查询该 userID 的通道,接着只需要发消息即可。

10.4在线用户接口


这是一个辅助接口,可以查询出当前在线用户信息。

6.jpg
7.jpg

实现也很简单,也就是查询之前保存 ”用户登录状态的那个去重 set “即可。

10.5私聊接口


之所以说获取在线用户是一个辅助接口,其实就是用于辅助私聊使用的。一般我们使用私聊的前提肯定得知道当前哪些用户在线,接着你才会知道你要和谁进行私聊。

类似于这样:


在我们这个场景中,私聊的前提就是需要获得在线用户的 userID:
9.jpg

所以私聊接口在收到消息后需要查询到接收者所在的 cim-server 实例信息,后续的步骤就和群聊一致了。调用接收者所在实例的 HTTP 接口下发信息。只是群聊是遍历所有的在线用户,私聊只发送一个的区别。

10.6下线接口


一旦客户端下线,我们就需要将之前存放在 Redis 中的一些信息删除掉(路由信息、登录状态)。

10.jpg

11.jpg

11、IM 客户端


客户端中的一些逻辑其实在上文已经谈到一些了。

11.1登录


第一步也就是登录,需要在启动时调用 route 的登录接口,获得 cim-server 信息再创建连接。

12.jpg

13.jpg

14.jpg

登录过程中 route 接口会判断是否为重复登录,重复登录则会直接退出程序。

15.jpg

接下来是利用 route 接口返回的 cim-server 实例信息(ip+port)创建连接。最后一步就是发送一个登录标志的信息到服务端,让它保持客户端和 Channel 的关系。

15-2.jpg

11.2自定义协议


上文提到的一些登录报文、真正的消息报文这些其实都是在我们自定义协议中可以区别出来的。由于是使用 Google Protocol Buffer 编解码,所以先看看原始格式。

16.jpg

其实这个协议中目前一共就三个字段:

  • 1)requestId 可以理解为 userId;
  • 2)reqMsg 就是真正的消息;
  • 3)type 也就是上文提到的消息类别。

目前主要是三种类型,分别对应不同的业务:
17.jpg

11.3心跳


为了保持客户端和服务端的连接,每隔一段时间没有发送消息都需要自动的发送心跳。

目前的策略是每隔一分钟就是发送一个心跳包到服务端:
18.jpg
19.jpg

这样服务端每隔一分钟没有收到业务消息时就会收到 ping 的心跳包:
20.jpg

11.4内置命令


客户端也内置了一些基本命令来方便使用。

21.jpg



比如输入 :q 就会退出客户端,同时会关闭一些系统资源。

23.jpg

24.jpg

当输入 :olu(onlineUser 的简写)就会去调用 route 的获取所有在线用户接口。

25.jpg

26.jpg

11.5群聊


群聊的使用非常简单,只需要在控制台输入消息回车即可。这时会去调用 route 的群聊接口。

27.jpg

11.6私聊


私聊也是同理,但前提是需要触发关键字;使用 userId;;消息内容 这样的格式才会给某个用户发送消息,所以一般都需要先使用 lu 命令获取所以在线用户才方便使用。

28.jpg

11.7消息回调


为了满足一些定制需求,比如消息需要保存之类的。所以在客户端收到消息之后会回调一个接口,在这个接口中可以自定义实现。

29.jpg

30.jpg

因此先创建了一个 caller 的 bean,这个 bean 中包含了一个 CustomMsgHandleListener 接口,需要自行处理只需要实现此接口即可。

11.8自定义界面


由于我自己不怎么会写界面,但保不准有其他大牛会写。所以客户端中的群聊、私聊、获取在线用户、消息回调等业务(以及之后的业务)都是以接口形式提供。

也方便后面做页面集成,只需要调这些接口就行了;具体实现不用怎么关心。

12、本文小结


cim 目前只是第一版,BUG 多,功能少(只拉了几个群友做了测试);不过后续还会接着完善,至少这一版会给那些没有相关经验的朋友带来一些思路。

后续计划:
31.jpg

附录:更多IM相关文章


[1] 有关IM代码实践的文章:
自已开发IM有那么难吗?手把手教你自撸一个Andriod版简易IM (有源码)
一种Android端IM智能心跳算法的设计与实现探讨(含样例代码)
手把手教你用Netty实现网络通信程序的心跳机制、断线重连机制
适合新手:从零开发一个IM服务端(基于Netty,有完整源码)
适合新手:手把手教你用Go快速搭建高性能、可扩展的IM系统(有源码)
详解Netty的安全性:原理介绍、代码演示(上篇)
详解Netty的安全性:原理介绍、代码演示(下篇)
微信本地数据库破解版(含iOS、Android),仅供学习研究 [附件下载]
Java NIO基础视频教程、MINA视频教程、Netty快速入门视频 [有源码]
轻量级即时通讯框架MobileIMSDK的iOS源码(开源版)[附件下载]
开源IM工程“蘑菇街TeamTalk”2015年5月前未删减版完整代码 [附件下载]
微信本地数据库破解版(含iOS、Android),仅供学习研究 [附件下载]
NIO框架入门(一):服务端基于Netty4的UDP双向通信Demo演示 [附件下载]
NIO框架入门(二):服务端基于MINA2的UDP双向通信Demo演示 [附件下载]
NIO框架入门(三):iOS与MINA2、Netty4的跨平台UDP双向通信实战 [附件下载]
NIO框架入门(四):Android与MINA2、Netty4的跨平台UDP双向通信实战 [附件下载]
用于IM中图片压缩的Android工具类源码,效果可媲美微信 [附件下载]
高仿Android版手机QQ可拖拽未读数小气泡源码 [附件下载]
一个WebSocket实时聊天室Demo:基于node.js+socket.io [附件下载]
Android聊天界面源码:实现了聊天气泡、表情图标(可翻页) [附件下载]
高仿Android版手机QQ首页侧滑菜单源码 [附件下载]
开源libco库:单机千万连接、支撑微信8亿用户的后台框架基石 [源码下载]
分享java AMR音频文件合并源码,全网最全
微信团队原创Android资源混淆工具:AndResGuard [有源码]
一个基于MQTT通信协议的完整Android推送Demo [附件下载]
Android版高仿微信聊天界面源码 [附件下载]
高仿手机QQ的Android版锁屏聊天消息提醒功能 [附件下载]
高仿iOS版手机QQ录音及振幅动画完整实现 [源码下载]
Android端社交应用中的评论和回复功能实战分享[图文+源码]
Android端IM应用中的@人功能实现:仿微博、QQ、微信,零入侵、高可扩展[图文+源码]
仿微信的IM聊天时间显示格式(含iOS/Android/Web实现)[图文+源码]
Android版仿微信朋友圈图片拖拽返回效果 [源码下载]
适合新手:从零开发一个IM服务端(基于Netty,有完整源码)
拉起键盘就是干:跟我一起徒手撸一套分布式IM系统
>> 更多同类文章 ……

[2] 有关IM架构设计的文章:
浅谈IM系统的架构设计
简述移动端IM开发的那些坑:架构设计、通信协议和客户端
一套海量在线用户的移动端IM架构设计实践分享(含详细图文)
一套原创分布式即时通讯(IM)系统理论架构方案
从零到卓越:京东客服即时通讯系统的技术架构演进历程
蘑菇街即时通讯/IM服务器开发之架构选择
腾讯QQ1.4亿在线用户的技术挑战和架构演进之路PPT
微信后台基于时间序的海量数据冷热分级架构设计实践
微信技术总监谈架构:微信之道——大道至简(演讲全文)
如何解读《微信技术总监谈架构:微信之道——大道至简》
快速裂变:见证微信强大后台架构从0到1的演进历程(一)
17年的实践:腾讯海量产品的技术方法论
移动端IM中大规模群消息的推送如何保证效率、实时性?
现代IM系统中聊天消息的同步和存储方案探讨
IM开发基础知识补课(二):如何设计大量图片文件的服务端存储架构?
IM开发基础知识补课(三):快速理解服务端数据库读写分离原理及实践建议
IM开发基础知识补课(四):正确理解HTTP短连接中的Cookie、Session和Token
WhatsApp技术实践分享:32人工程团队创造的技术神话
微信朋友圈千亿访问量背后的技术挑战和实践总结
王者荣耀2亿用户量的背后:产品定位、技术架构、网络方案等
IM系统的MQ消息中间件选型:Kafka还是RabbitMQ?
腾讯资深架构师干货总结:一文读懂大型分布式系统设计的方方面面
以微博类应用场景为例,总结海量社交系统的架构设计步骤
快速理解高性能HTTP服务端的负载均衡技术原理
子弹短信光鲜的背后:网易云信首席架构师分享亿级IM平台的技术实践
知乎技术分享:从单机到2000万QPS并发的Redis高性能缓存实践之路
IM开发基础知识补课(五):通俗易懂,正确理解并用好MQ消息队列
微信技术分享:微信的海量IM聊天消息序列号生成实践(算法原理篇)
微信技术分享:微信的海量IM聊天消息序列号生成实践(容灾方案篇)
新手入门:零基础理解大型分布式架构的演进历史、技术原理、最佳实践
一套高可用、易伸缩、高并发的IM群聊、单聊架构方案设计实践
阿里技术分享:深度揭秘阿里数据库技术方案的10年变迁史
阿里技术分享:阿里自研金融级数据库OceanBase的艰辛成长之路
社交软件红包技术解密(一):全面解密QQ红包技术方案——架构、技术实现等
社交软件红包技术解密(二):解密微信摇一摇红包从0到1的技术演进
社交软件红包技术解密(三):微信摇一摇红包雨背后的技术细节
社交软件红包技术解密(四):微信红包系统是如何应对高并发的
社交软件红包技术解密(五):微信红包系统是如何实现高可用性的
社交软件红包技术解密(六):微信红包系统的存储层架构演进实践
社交软件红包技术解密(七):支付宝红包的海量高并发技术实践
社交软件红包技术解密(八):全面解密微博红包技术方案
社交软件红包技术解密(九):谈谈手Q红包的功能逻辑、容灾、运维、架构等
即时通讯新手入门:一文读懂什么是Nginx?它能否实现IM的负载均衡?
即时通讯新手入门:快速理解RPC技术——基本概念、原理和用途
多维度对比5款主流分布式MQ消息队列,妈妈再也不担心我的技术选型了
从游击队到正规军:马蜂窝旅游网的IM系统架构演进之路
IM开发基础知识补课(六):数据库用NoSQL还是SQL?读这篇就够了!
>> 更多同类文章 ……

即时通讯网 - 即时通讯开发者社区! 来源: - 即时通讯开发者社区!

上一篇:跟着源码学IM(三):基于Netty,从零开发一个IM服务端下一篇:从游击队到正规军(二):马蜂窝旅游网的IM客户端架构演进和实践总结

本帖已收录至以下技术专辑

推荐方案
评论 21
加个微信呀,大佬,我也在互联网产业园区!
楼主有一个疑问,如果按你现在的结构,需要加上mq吗?
为什么发送聊天消息要走http,不走tcp,性能会有影响吗
引用:burukeYou 发表于 2019-12-31 15:05
**** 作者被禁止或删除 内容自动屏蔽 ****

自己调试玩玩没事,高并发下,这样不行,会影响性能
引用:burukeYou 发表于 2019-12-31 15:05
**** 作者被禁止或删除 内容自动屏蔽 ****

肯定会有影响。实话实说,本文作者应该是第一次写im,不足的地方比较明显。
不过,对于新手来说,原理比代码更重要。
总之,还是要感谢原作者的分享。
引用:王逸宸 发表于 2020-09-14 10:41
自己调试玩玩没事,高并发下,这样不行,会影响性能

是的

请问一下 这个系统的设计哪里有问题?瓶颈在哪里?能详细说一下不
引用:陪白 发表于 2020-10-20 14:28
请问一下 这个系统的设计哪里有问题?瓶颈在哪里?能详细说一下不

作者的实现里,发消息是通过http来实现的
引用:JackJiang 发表于 2020-10-20 15:39
作者的实现里,发消息是通过http来实现的

大佬 请问一下 如果数据多了,也就是历史聊天记录是通过定时任务删除的吗?如果是的话,定时时间一般是几点?
引用:陪白 发表于 2020-10-21 09:36
大佬 请问一下 如果数据多了,也就是历史聊天记录是通过定时任务删除的吗?如果是的话,定时时间一般是几 ...

准确地说是定时转储,存到冷数据表里,供产品运营后台查阅。定时时间按自已app的运行情况来定啦,消息堆积在服务端性能可承受范围就可以
作为一枚im新手,刚才看到之后一直在思考,这个架构的client端是不是不能是 ios、pc、桌面版、小程序呢?
因为我理解,改架构的 router 主要作用是使用zk发现服务,然后拿到ip端口号在直连server。ios、pc这种应该是无法使用router层吧?
想到这突然想起来,可以通过http请求router,然后各个client在分别实现内存缓存,但好像没办法监听宕机或者加机器的情况吧。好纠结。
引用:云飞落灯花 发表于 2021-04-22 20:36
作为一枚im新手,刚才看到之后一直在思考,这个架构的client端是不是不能是 ios、pc、桌面版、小程序呢?
...

im由两种服务组成:socket长连接和http短连接,socket长连接是可以实时双向通信的,它就可以解决你疑问里的问题了。
引用:JackJiang 发表于 2021-04-22 23:36
im由两种服务组成:socket长连接和http短连接,socket长连接是可以实时双向通信的,它就可以解决你疑问里 ...

你说的对,当socket断开的时候可以尝试 通过http找zk把存活的拉下来,或者本地内存在随机连接一个。

想问一下 这种架构 client->router  然后在直连server 跟 client直接连域名的方式拿到ip再去练server 这两种有什么区别 那个更好呢
引用:云飞落灯花 发表于 2021-04-23 10:27
你说的对,当socket断开的时候可以尝试 通过http找zk把存活的拉下来,或者本地内存在随机连接一个。

...

前者可以扩展为LBS负载均衡架构,这是中大型IM系统里必备的
你好,楼主,请问client router 架构适合用网关作为入口嘛?
引用:逍遥小子 发表于 2021-05-06 12:22
你好,楼主,请问client router 架构适合用网关作为入口嘛?

所谓的网关,只是个名字,并不是什么标准,没有严格定义
引用:JackJiang 发表于 2021-05-06 13:54
所谓的网关,只是个名字,并不是什么标准,没有严格定义

像现在流行的微服务,有微服务网关这个中间件,个人感觉在http无状态连接场景用的多。
倒是没有广泛见过tcp网关这个概念。请教下楼主,im架构里面是不是接入层大部分都是用tcp-server集群来实现接入层的?而不是网关。
  楼主你说的没有严格定义是不是这两个是同一个概念
引用:逍遥小子 发表于 2021-05-06 18:22
像现在流行的微服务,有微服务网关这个中间件,个人感觉在http无状态连接场景用的多。
倒是没有广泛见过 ...

你读一下这篇《谈谈移动端 IM 开发中登录请求的优化》,注意一下LBS这个东西
非常不错,赞
签名: 终于注册上了,谢谢
打赏楼主 ×
使用微信打赏! 使用支付宝打赏!

返回顶部