从URL输入到页面展现,这中间到底发生了什么?

4 评论 4827 浏览 36 收藏 10 分钟

打开浏览器从输入网址到网页呈现在大家面前,背后到底发生了什么?经历怎么样的一个过程?

先给大家来张总体流程图,具体步骤请看下文分解!

从URL输入到页面展现

一、URL到底是啥

URL(Uniform Resource Locator),统一资源定位符,用于定位互联网上资源,俗称网址。比如: http://www.w3school.com.cn/html/index.asp,遵守以下的语法规则scheme://host.domain:port/path/filename

各部分解释如下:

  • scheme – 定义因特网服务的类型。常见的协议有http、https、ftp、file,其中最常见的类型是 http,而https则是进行加密的网络传输。
  • host – 定义域主机(http 的默认主机是 www)。
  • domain – 定义因特网域名,比如 w3school.com.cn。
  • port – 定义主机上的端口号(http 的默认端口号是 80)。
  • path – 定义服务器上的路径(如果省略,则文档必须位于网站的根目录中)。
  • filename – 定义文档/资源的名称。

二、域名解析(DNS)

在浏览器输入网址后,首先要经过域名解析,因为浏览器并不能识别域名,需要通过域名直接找到相应的IP地址。大家这里或许会有个疑问——为啥要设置域名?怎么不一开始就给个IP地址?这样可以省去解析麻烦。

我们先来了解下什么是IP地址?

1. IP地址

IP地址是指互联网协议地址,是IP Address的缩写。IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。IP地址是一个32位的二进制数,比如:127.0.0.1为本机IP,如果每个网址都是一串数字,那就不便于记忆!

域名就相当于IP地址乔装打扮的伪装者,带着一副面具,它的作用就是便于记忆和沟通的一组服务器的地址。

但这样有时候会带来一种风险——DNS劫持,就是使域名对应的不再是原本对应的IP,其效果就是对特定的网络不能访问或访问的是假网址,又难于被用户发觉,曾导致巴西最大银行巴西银行近1%客户受到攻击而导致账户被盗。

2. 什么是域名解析

DNS是一个网络服务器,我们的域名解析简单来说就是在DNS上记录一条信息记录。例如:baidu.com 220.114.23.56(服务器外网IP地址)80(服务器端口号)。

浏览器通过向DNS服务器发送域名,DNS服务器查询到与域名相对应的IP地址,然后返回给浏览器,浏览器再将IP地址打在协议上,同时请求参数也会在协议搭载,然后一并发送给对应的服务器,下一步就到了服务器处理阶段的工作。

3. 域名解析流程

  • 浏览器缓存:如果在之前对该url指定的主机进行过访问,浏览器会缓存该主机的IP一段时间(该时间浏览器指定),然后通过该IP地址找到对应主机;
  • 系统缓存:若浏览器中无该缓存,那么就到系统缓存中进行查询,浏览器会进行系统调用,查询缓存;
  • 路由器缓存:如果系统缓存中也没有,那么就到路由器缓存中进行查询;
  • ISP DNS 缓存:如果路由器缓存依旧未命中,那么就到ISP DNS中查询,一般的域名都能在这里查询得到;
  • 递归搜索:如果以上都没有查询到,那么就会到顶级域名服务器的根服务器中进行递归查询,只要该域名存在就肯定能找得到。

三、服务器处理响应请求

1. 服务器

服务器是网络环境中的高性能计算机,它侦听网络上的其他计算机(客户机)提交的服务请求,并提供相应的服务。比如:网页服务、文件下载服务、邮件服务、视频服务。

而客户端主要的功能是浏览网页、看视频、听音乐等等,两者截然不同。 每台服务器上都会安装处理请求的应用——web server,常见的web server产品有apache、nginx、IIS或Lighttpd等。

web server 担任管控的角色,对于不同用户发送的请求,会结合配置文件,把不同请求委托给服务器上处理相应请求的程序进行处理(例如:CGI脚本,JSP脚本,servlets,ASP脚本,服务器端JavaScript,或者一些其它的服务器端技术等),然后返回后台程序处理产生的结果作为响应。

服务器和客户端区别

2. MVC后台处理阶段

后台开发现在有很多框架,但大部分都还是按照MVC设计模式进行搭建的。

MVC是一个设计模式,将应用程序分成三个核心部件:模型(model)——视图(view)——控制器(controller),它们各自处理自己的任务,实现输入、处理和输出的分离。

MVC架构

(1)视图(view)

它是提供给用户的操作界面,是程序的外壳。

(2)模型(model)

模型主要负责数据交互,在MVC的三个部件中,模型拥有最多的处理任务,一个模型能为多个视图提供数据。

(3)控制器(controller)

它负责根据用户从”视图层”输入的指令,选取”模型层”中的数据,然后对其进行相应的操作,产生最终结果。控制器属于管理者角色,从视图接收请求并决定调用哪个模型构件去处理请求,然后再确定用哪个视图来显示模型处理返回的数据。

这三层是紧密联系在一起的,但又是互相独立的,每一层内部的变化不影响其他层,每一层都对外提供接口(Interface),供上面一层调用。

至于这一阶段发生什么?

简而言之,首先浏览器发送过来的请求先经过控制器,控制器进行逻辑处理和请求分发,接着会调用模型。这一阶段模型会获取redis db以及MySQL的数据,获取数据后将渲染好的页面,通过视图返回给浏览器,最后浏览器通过渲染引擎将网页呈现在用户面前。因此,下一步就来到浏览器处理阶段

四、浏览器的处理

浏览器拿到响应文本HTML后,以chrome浏览器为例,介绍下浏览器渲染机制

chrome浏览器渲染机制:

  • 处理 HTML 标记并构建 DOM 树。
  • 处理 CSS 标记并构建 CSSOM 树。
  • 将 DOM 与 CSSOM 合并成一个渲染树(render 树)。
  • 根据渲染树来布局,以计算每个节点(也就是每个Element)的几何位置,这又叫layout和reflow过程。
  • 最后通过调用操作系统Native GUI的API绘制,将各个节点绘制到屏幕上。
  • 于是就来到了绘制网页的最后阶段。

五、绘制网页

浏览器根据html和css计算得到渲染树之后,将渲染好的页面图像显示出来,即绘制网页,并开始响应用户的操作。

六、后记

随着学习的深入,对于页面加载这个主题认识更加深刻,之前一些困惑点现在都迎刃而解。

 

作者:浪里行舟

原文链接:https://www.jianshu.com/p/40d76ebb94e2

本文由 @浪里行舟 授权发布于人人都是产品经理,未经作者许可,禁止转载

题图来自Unsplash,基于CCO协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 学习了,谢谢

    来自北京 回复
  2. 很清楚,谢谢作者的分析

    来自浙江 回复
  3. 来过、学习、感谢

    来自浙江 回复