Debian下怎么搭建Nginx和Tomcat服务器实现负载均衡

91次阅读
没有评论

共计 9362 个字符,预计需要花费 24 分钟才能阅读完成。

这篇文章主要介绍了 Debian 下怎么搭建 Nginx 和 Tomcat 服务器实现负载均衡的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇 Debian 下怎么搭建 Nginx 和 Tomcat 服务器实现负载均衡文章都会有所收获,下面我们一起来看看吧。

负载均衡的基本概念

负载平衡(load balancing)是一种计算机网络技术,用来在多个计算机(计算机集群)、网络连接、cpu、磁盘驱动器或其他资源中分配负载,以达到最佳化资源使用、最大化吞吐率、最小化响应时间、同时避免过载的目的。

使用带有负载平衡的多个服务器组件,取代单一的组件,可以通过冗余提高可靠性。负载平衡服务通常是由专用软体和硬件来完成。

负载平衡最重要的一个应用是利用多台服务器提供单一服务,这种方案有时也称之为服务器农场。通常,负载平衡主要应用于 web 网站,大型的 internet relay chat 网络,高流量的文件下载网站,nntp(network news transfer protocol)服务和 dns 服务。现在负载平衡器也开始支持数据库服务,称之为数据库负载平衡器。

对于互联网服务,负载平衡器通常是一个软体程序,这个程序侦听一个外部端口,互联网用户可以通过这个端口来访问服务,而作为负载平衡器的软体会将用户的请求转发给后台内网服务器,内网服务器将请求的响应返回给负载平衡器,负载平衡器再将响应发送到用户,这样就向互联网用户隐藏了内网结构,阻止了用户直接访问后台(内网)服务器,使得服务器更加安全,可以阻止对核心网络栈和运行在其它端口服务的攻击。

当所有后台服务器出现故障时,有些负载平衡器会提供一些特殊的功能来处理这种情况。例如转发请求到一个备用的负载平衡器、显示一条关于服务中断的消息等。负载平衡器使得 it 团队可以显著提高容错能力。它可以自动提供大量的容量以处理任何应用程序流量的增加或减少。

0. 前期准备

使用 debian 环境。安装 nginx(默认安装),一个 web 项目,安装 tomcat(默认安装) 等。

1. 一份 nginx.conf 配置文件

#  定义 nginx 运行的用户   和   用户组   如果对应服务器暴露在外面的话建议使用权限较小的用户   防止被入侵
# user www www;
#nginx 进程数,  建议设置为等于 cpu 总核心数
worker_processes 8;
#开启全局错误日志类型
error_log /var/log/nginx/error.log info;
#进程文件
pid /var/run/nginx.pid;
#一个 nginx 进程打开的最多文件描述数目   建议与 ulimit - n 一致
#如果面对高并发时   注意修改该值  ulimit -n  还有部分系统参数   而并非这个单独确定
worker_rlimit_nofile 65535;
events{
 # 使用 epoll 模型提高性能
 use epoll;
 # 单个进程最大连接数
 worker_connections 65535;
http{
 # 扩展名与文件类型映射表
 include mime.types;
 # 默认类型
 default_type application/octet-stream;
 sendfile on;
 tcp_nopush on;
 tcp_nodelay on;
 keepalive_timeout 65;
 types_hash_max_size 2048;
 # 日志
 access_log /var/log/nginx/access.log;
 error_log /var/log/nginx/error.log;
 #gzip  压缩传输
 gzip on;
 gzip_min_length 1k; # 最小 1k
 gzip_buffers 16 64k;
 gzip_http_version 1.1;
 gzip_comp_level 6;
 gzip_types text/plain application/x-javascript text/css application/xml application/javascript;
 gzip_vary on;
 # 负载均衡组
 # 静态服务器组
 upstream static.zh-jieli.com {
 server 127.0.0.1:808 weight=1;
 }
 # 动态服务器组
 upstream zh-jieli.com {
 server 127.0.0.1:8080;
 #server 192.168.8.203:8080;
 }
 # 配置代理参数
 proxy_redirect off;
 proxy_set_header host $host;
 proxy_set_header x-real-ip $remote_addr;
 proxy_set_header x-forwarded-for $proxy_add_x_forwarded_for;
 client_max_body_size 10m;
 client_body_buffer_size 128k;
 proxy_connect_timeout 65;
 proxy_send_timeout 65;
 proxy_read_timeout 65;
 proxy_buffer_size 4k;
 proxy_buffers 4 32k;
 proxy_busy_buffers_size 64k;
 # 缓存配置
 proxy_cache_key  $host:$server_port$request_uri 
 proxy_temp_file_write_size 64k;
 proxy_temp_path /dev/shm/jielierp/proxy_temp_path;
 proxy_cache_path /dev/shm/jielierp/proxy_cache_path levels=1:2 keys_zone=cache_one:200m inactive=5d max_size=1g;
 proxy_ignore_headers x-accel-expires expires cache-control set-cookie;
server{
 listen 80;
 server_name erp.zh-jieli.com;
 location / {
 index index; # 默认主页为  /index
 #proxy_pass http://jieli;
 }
 location ~ .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
 proxy_cache cache_one;
 proxy_cache_valid 200 304 302 5d;
 proxy_cache_valid any 5d;
 proxy_cache_key  $host:$server_port$request_uri 
 add_header x-cache  $upstream_cache_status from $host 
 proxy_pass http:
//static.zh-jieli.com;
 # 所有静态文件直接读取硬盘
 # root /var/lib/tomcat7/webapps/jielierp/web-inf ;
 expires 30d; # 缓存 30 天
 }
 # 其他页面反向代理到 tomcat 容器
 location ~ .*$ {
 index index;
 proxy_pass http:
//zh-jieli.com;
 }
 }
 server{
 listen 808;
 server_name static;
 location / { location ~ .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
 # 所有静态文件直接读取硬盘
 root /var/lib/tomcat7/webapps/jielierp/web-inf ;
 expires 30d; # 缓存 30 天
 }
 }
}

基本配置这个文件,就可以实现负载了。但是里面的各种关系要了解就比较麻烦了。

2. 基础讲解

现在假使有一台电脑 192.168.8.203 这台电脑,上面部署了 tomcat,里面 8080 端口有 j2ee 的服务,通过浏览器可以正常浏览网页。现在有一个问题 tomcat 是一个比较全面的 web 容器,对静态网页的处理,应该是比较费资源的,特别是每次都要从磁盘读取静态页面,然后返回。这中间会消耗 tomcat 的资源,可能会使那些动态页面解析性能影响。秉承 linux 哲学,一个软件只做一件事的原则。tomcat 就应该只处理 jsp 动态页面。这里就用到以前了解的 nginx 来进行反向代理。第一步代理,实现动静网页分离。这个很简单的。

worker_processes 8;
 
 pid /var/run/nginx.pid;
 
 worker_rlimit_nofile 65535;
 
 events{
 use epoll;
 worker_connections 65535;
 }
 
 http{
 include mime.types;
 default_type application/octet-stream;
 sendfile on;
 tcp_nopush on;
 tcp_nodelay on;
 keepalive_timeout 65;
 types_hash_max_size 2048;
proxy_redirect off;
 proxy_set_header host $host;
 proxy_set_header x-real-ip $remote_addr;
 proxy_set_header x-forwarded-for $proxy_add_x_forwarded_for;
 client_max_body_size 10m;
 client_body_buffer_size 128k;
 proxy_connect_timeout 65;
 proxy_send_timeout 65;
 proxy_read_timeout 65;
 proxy_buffer_size 4k;
 proxy_buffers 4 32k;
 proxy_busy_buffers_size 64k;
 
 server{
 listen 80;
 server_name xxx.com;
 location / {
 index index; 
 }
 location ~ .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
 proxy_pass http:
//192.168.8.203:8080;
 expires 30d; 
 }
 location ~ .*$ {
 index index;
 proxy_pass http:
//192.168.8.203:8080;
 }
 }
 }
worker_processes 8;
pid /var/run/nginx.pid;
worker_rlimit_nofile 65535;
events{
 use epoll;
 worker_connections 65535;
 }
http{
 include mime.types;
 default_type application/octet-stream;
 sendfile on;
 tcp_nopush on;
 tcp_nodelay on;
 keepalive_timeout 65;
 types_hash_max_size 2048;
proxy_redirect off;
 proxy_set_header host $host;
 proxy_set_header x-real-ip $remote_addr;
 proxy_set_header x-forwarded-for $proxy_add_x_forwarded_for;
 client_max_body_size 10m;
 client_body_buffer_size 128k;
 proxy_connect_timeout 65;
 proxy_send_timeout 65;
 proxy_read_timeout 65;
 proxy_buffer_size 4k;
 proxy_buffers 4 32k;
 proxy_busy_buffers_size 64k;
server{
 listen 80;
 server_name xxx.com;
 location / {
 index index;
 }
 location ~ .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
 proxy_pass http:
//192.168.8.203:8080;
 expires 30d;
 }
 location ~ .*$ {
 index index;
 proxy_pass http:
//192.168.8.203:8080;
 }
 }
 }

修改 nginx 的配置文件 /etc/nginx/nginx.conf 默认有个配置文件的。其实大部分都差不多,关键还是 server 段的设置。这里我设置 server 段如上所示,其他段复制就可以了。server 段里面的解释如下:第 35 行为监听本机 80 端口。37-39 行表示默认主页,这里的默认主页我是 index.jsp 对应到我项目中是一个 index。这里根据需要可以改为

index index.jsp index.html index.htm index.php

具体可参考其他文章。关键的第 40 行,这个是正则匹配,网上也有很多介绍。这里匹配我项目中用到的所有静态网页后缀。第 41 行是代理地址。这里我代理到我的 web 应用中。expires 30d 缓存为 30 天,这里的缓存是对应到前端页面,用户的 cache-control 字段,

第 44 行中那个正则是匹配无后缀的页面。我项目中 jsp 页面是无后缀的。这里可以根据需要进行修改。同样代理到 192.168.8.203:8080 这里。到这里你可能会问,我艹,这有毛意思啊?当然不是这样了。简单的实现静动分离,我们可以把第 41 行进行修改,改为

root /var/lib/tomcat7/webapps/jielierp/web-inf

表示不代理,直接从本地磁盘拿。通过查 tomcat 日志可以看到静态页面是没有访问到的。但这样又有一个问题。这样的灵活性不好,对下面要讲到的内存缓存和集群部署来说都是不友好的,所以又有了下面的这种写法。再写一个 server 段。

server{
 listen 808;
 server_name static;
 location / {location ~ .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
 # 所有静态文件直接读取硬盘
 root /var/lib/tomcat7/webapps/jielierp/web-inf ;
 expires 30d; # 缓存 30 天
 }
 }

这次监听 808 端口,然后上上面的代码 41 行就可以修改为 proxy_pass http://192.168.8.203:808 了,到这里就实现了动静分离了。如果多台服务器,就修改对应的 ip 就可以了。如果发现连接不上的,要检查一下防火墙,权限等外部问题,这个配置是这样的。

如果单纯这样的话,我们会发现页面直接传输过于占用带宽。对应 web 的优化,这里想到的是通过对页面进行 gzip 压缩,然后传到用户那里,再解压,这样可以有效的减少带宽。这里就会用到 nginx 的 gzip 模块了。默认的 nginx 是集成有 gzip 模块的。只需在 http 段增加下面配置即可。

gzip on;
 gzip_min_length 1k; # 最小 1k
 gzip_buffers 16 64k;
 gzip_http_version 1.1;
 gzip_comp_level 6;
 gzip_types text/plain application/x-javascript text/css application/xml application/javascript;
 gzip_vary on;

给个首页看看效果

不要在意请求数不一样,那两个请求是谷歌插件来的。不用觉得我在骗你。

作为假使有很多人访问的网站来说,缓存肯定是很重要的东西了。一开始是想通过插件,让 nginx 和 redis 进行合成,然后 nginx 使用 redis 来缓存的,但是发现配置起来很麻烦,还要自己下载插件,重新编译 nginx,比较麻烦,所以这里觉得用 nginx 自带的缓存也是不错的选择。虽然效率比不上 redis,但是有还是比没有好。nginx 默认的缓存是磁盘文件系统的缓存,而不是像 redis 那样的内存级别的缓存。一开始我以为 nginx 就只有这样。后来查了写资料,才知道是我太天真了,对 linux 不是很了解导致的。linux 的一切皆文件。原来我们可以把文件缓存到内存对应的 linux 文件系统中。我说的可能比较难以理解,请自行搜索 /dev/shm 这个文件目录。我们把文件缓存到这个文件目录里,其实就相当与内存的缓存了。只不过还是靠文件系统管理。所以比不上自定义格式的 redis 那样的内存缓存。

在 http 段进行基本配置

# 缓存配置
proxy_cache_key  $host:$server_port$request_uri 
proxy_temp_file_write_size 64k;
proxy_temp_path /dev/shm/jielierp/proxy_temp_path;
proxy_cache_path /dev/shm/jielierp/proxy_cache_path levels=1:2 keys_zone=cache_one:200m inactive=5d max_size=1g;
proxy_ignore_headers x-accel-expires expires cache-control set-cookie;
location ~ .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
 proxy_cache cache_one;
 proxy_cache_valid 200 304 302 5d;
 proxy_cache_valid any 5d;
 proxy_cache_key  $host:$server_port$request_uri 
 add_header x-cache  $upstream_cache_status from $host 
 proxy_pass http:
//192.168.8.203:808;
expires 30d; # 缓存 30 天
 }

经过这两个的配置就基本能实现了,这里说几个注意项,也是困扰我很久的问题。上面第一段代码第 6 行,proxy_ignore_headers 如果 web 项目中的 html 的 head 头里面指定

meta http-equiv= pragma  content= no-cache 
 meta http-equiv= cache-control  content= no-cache 
 meta http-equiv= expires  content= 0

这些不缓存的话,就要加上 proxy_ignore_headers 的配置项了。还有一点就是 /dev/shm 下面的文件系统权限默认只给 root 用户,所以要 chmod 777 -r /dev/shm 这样不是很安全的做法,如果实际上线可以给定某个用户组,关于用户组的设置是配置的第一行

user www www;

上面第二段代码的第 6 行是增加一个 header 字段方便查看是否击中缓存。

我们 rm -rf /dev/shm/jielierp/proxy_* 下面的所有文件 (注意这里如果是进行多次测试的话要 nginx -s reload 重新读取配置或重启服务,因为你 rm -rf 只是删除了缓存文件,但是缓存的结构信息还在 nginx 进程里面,结构还在,如果不重启的话,是会出现访问不到的)

所以要记得重启哦。下面是运行效果

第一次访问

第二次访问,在浏览器中 ctrl+shift+r 强制刷新

到这里就可以看到效果了。我们查看一下 /dev/shm 这个里面

到这里已经快结束了。最后也是比较关键的一个技术点,就是集群,集群,集群。这个就要用到 upstream 了,看到最开头的配置文件了吗,就是那个

# 负载均衡组
#静态服务器组
upstream static {
 server 127.0.0.1:808 weight=1;
 server 192.168.8.203:808 weight=1;
#动态服务器组
upstream dynamic {
 server 127.0.0.1:8080;
 #server 192.168.8.203:8080;
}

上面那个就是集群组了。upstream 是关键字,static 和 dynamic 是两个服务器集群组的名称。以第一个为例,server 127.0.0.1:808 是服务器地址,后面的 weight=1 是权重。有多个就写多个。亲测试过,集群中的一个坏了,不影响系统运行。至于更多的轮询规则,可以参考网上更多的资料。这里不多说。至于怎么使用呢?proxy_pass http://192.168.8.203:808 改为 proxy_pass http://static; 这样即可实现均衡。

到这里就结束了。把上面各个部分根据自己需求配置起来就可以实现单机房负载均衡了。上面这种做法有一个缺点就是在前面的那一台 nginx 如果当机,后面所以机器就失去了被访问的能力了,所以需要在前面实现多个 nginx 多机房的负载。关于这个就是另外一个话题了。目前还没有研究。以后有机会再说了。

上面动态服务器组如果是那种需要保存用户状态的话,会有问题,就是 session 问题,比如我在 server1 进行登录后,下一次动态服务器组进行轮询后可能分配到 server2,就会造成要重新登录。治标的办法是,配置轮询规则,根据用户请求的 ip 进行 hash,然后分配对应的服务器。具体配置如下:

upstream dynamic{
ip_hash;
server 127.0.0.1:8080;
server 192.168.0.203:8080;
}

这样就可以实现一个用户对应一个服务器节点。这样就不会有重复登录的问题。另一种治本的办法是,利用缓存系统进行 session 的统一存储管理。

关于“Debian 下怎么搭建 Nginx 和 Tomcat 服务器实现负载均衡”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“Debian 下怎么搭建 Nginx 和 Tomcat 服务器实现负载均衡”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注丸趣 TV 行业资讯频道。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-17发表,共计9362字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)