브라우저가 HTML, CSS, 자바스크립트로 작성된 텍스트 문서를 파싱하는 과정을 살펴보자.
파싱
문서의 문자열을 토큰으로 분해하고,
토큰에 문법적 의미와 구조를 반영해 트리 구조의 파스트리를 생성하는 과정이다.
파싱이 완료된 이후에는 그 파스 트리를 기반으로 중간언어인 바이트코드를 생성하고 실행한다.
렌더링
HTML, CSS, 자바스크립트로 작성된 문서를 파싱해 브라우저에 시각적으로 출력하는 것이다.
브라우저는 다음과 같은 과정을 거쳐 렌더링을 수행한다.
- 브라우저는 HTML, CSS, 자바스크립트, 이미지 등 렌더링에 필요한 리소스를 요청하고 서버로부터 응답받음
- 브라우저에 탑재된 렌더링 엔진은 서버로부터 응답받은 HTML과 CSS 를 파싱해 DOM과 CSSOM 을 생성하고
이를 결합해 렌더트리 생성함 - 브라우저에 탑재된 자바스크립트 엔진은 서버로부터 응답됩 자바스크립트를 파싱해 AST(Abstract Syntax Tree)를 생성하고
바이트코드로 변환하여 실행함. 이때 자바스크립트는 DOM API 를 통해 DOM 이나 CSSOM을 변경할 수 있음.
변경된 DOM 과 CSSOM은 다시 렌더 트리로 결합됨 - 렌더 트리를 기반으로 HTML 요소의 레이아웃을 계산하고 브라우저 화면에 HTML 요소 페인팅함
요청과 응답
서버에 요청을 한 이후 반환받는 리소스들은 크롬 브라우저의 network 탭에서 확인할 수 있는데,
우리가 직접적으로 요청하지 않은 css, 자바스크립트, 폰트 등도 응답된 것을 볼 수 있다.
이는 브라우저의 렌더링 엔진이 HTML 을 파싱하는 도중에 외부 리소스를 로드하는 태그
(css 로드용 link 태그, img 태그 등)를 만나면 HTML 의 파싱을 일시 중지하고 해당 리소스 파일을 서버로 요청하기 때문이다.
HTTP 1.1과 HTTP 2.0
HTTP는 웹에서 브라우저와 서버가 통신하기 위한 프로토콜이다.
1989년에 HTML, URL 과 함게 팀 버너스리가 고안한 HTTP 는 1991년 최초로 문서화 되었고,
이후 1996년 HTTP/1.0, 1999 HTTP/1.1, 2015년 HTTP/2 가 발표되었다.
HTTP/1.1은 기본적으로 커넥션 당 하나의 요청과 응답만 처리한다.
다시 말하자면 여러개의 요청을 한번에 전송할 수 없고, 응답도 마찬가지다.
따라서 HTML 문서 내 포함된 여러개 리소스 요청이 개별적으로 전송되고 응답 또한 개별적으로 전송된다.
리소스의 동시 전송이 불가능한 구조이므로 요청할 리소스의 개수에 비례해 응답 시간도 증가하는 단점이 있다.
HTTP/2는 커넥션당 여러 개의 요청과 응답(다중 요청/응답)이 가능하다.
따라서 여러 리소스의 동시 전송이 가능하므로 HTTP/1.1에 비해 페이지 로드 속도가 약 50%정도 빠르다고 알려져있다.
HTML 파싱과 DOM 생성
서버가 응답한 HTML 문서는 문자열로 이루어진 순수한 텍스트다.
이 텍스트인 HTML 문서를 브라우저에 시각적인 픽셀로 렌더링하려면 HTML 문서를 브라우저가 이해할 수 있는
자료구조(객체)로 변환하여 메모리에 저장해야 한다.
브라우저의 렌더링 엔진은 응답받은 HTML 문서를 파싱하여 브라우저가 이해할 수 있는 자료구조인 DOM을 생성한다.
자세한 과정은 아래와 같다.
- 서버에 존재하던 HTML 파일이 브라우저 요청에 의해 응답된다.
이때 서버는 브라우저가 요청한 HTML 파일을 읽어 들여 메모리에 저장한 다음
메모리에 저장된 바이트(2진수)를 인터넷을 경유해 응답한다. - 브라우저는 서버가 응답한 HTML 문서를 바이트(2진수) 형태로 응답 받고,
응답된 바이트 형태의 HTML 문서는 meta 태그의 charset 어트리뷰트에 의해 지정된 인코딩 방식(ex:UTF-8)을 기준으로
문자열로 변환된다.
(meta 태그의 charset 어트리뷰트에 선언된 인코딩 방식은 content-type: text/html; charset=utf-8 과 같이
응답 헤더에 담겨 응답된다. 브라우저는 이를 확인하고 문자열로 변환한다.) - 문자열로 변환된 HTML 문서를 읽어 들여 문법적 의미를 갖는 최소 단위인 토큰들로 분해한다.
- 각 토큰들을 객체로 변환해 노드들을 생성한다.
토큰의 내용에 따라 문서 노드, 요소 노드, 어트리뷰트 노드, 텍스트 노드가 생성된다.
노드는 이후 DOM을 구성하는 기본 요소가 된다. - HTML 문서는 HTML 요소들의 집합으로 이루어지며 HTML 요소는 중첩관계를 갖는다.
이때 HTML 요소 간에는 중첩 관계에 의해 부자관계가 생성되는데, 이러한 관계를 반영해 모든 노드들을
트리 자료구조로 구성한다.
이 노드들로 구성된 트리 자료구조를 DOM 이라 부른다.
즉 DOM은 HTML 문서를 파싱한 결과물이다.
CSS 파싱과 CSSOM 생성
렌더링 엔진은 HTML을 한 줄씩 순차적으로 파싱하여 DOM을 생성해나간다.
그러다가 CSS 를 로드하는 link 태그 혹은 style 태그를 만나면 DOM 생성을 일시 중단한다.
이후 link 태그의 href 어트리뷰트에 지정된 css 파일을 서버에 요청해 로드한 css 파일 혹은
style 태그 내의 css 를 바이트->문자->토큰->노드->CSSOM 을 거치며 해석한다.
결국 만들어지는 결과물은 CSSOM 이다.
이후 CSS 파싱을 완료하면 HTML 파싱이 중단된 지점부터 다시 HTML을 파싱하기 시작해
DOM 생성을 재개한다.
렌더 트리 생성
렌더링 엔진은 각각 DOM과 CSSOM를 생성한다.
그리고 이 둘은 렌더링을 위해 렌더 트리로 결합된다.
렌더 트리는 렌더링을 위한 트리 구조의 자료구조이기 때문에 브라우저 화면에
렌더링 되지않는 노드(meta 태그, script 태그 등)와 css 에 의해 비표시(display: none)되는 노드들은 포함하지 않는다.
렌더 트리는 브라우저 화면에 렌더링 되는 노드만으로 구성된다는 점을 알고 있으면 되겠다.
이후 완성된 렌더 트리는 각 HTML 요소의 레이아웃을 계산하는데 사용되고,
브라우저 화면에 픽셀을 렌더링하는 페인팅 처리에 입력된다.
지금까지 위에 장황하게 써놓은 과정들은 반복될 수 있다.
만약 자바스크립트에 의한 노드 추가 또는 삭제가 일어난다면?
브라우저 창의 크기가 변함으로 인한 뷰포트의 크기가 변한다면?
반복해서 레이아웃 계산과 페인팅이 실행되는 것이다.
레이아웃 계산과 페인팅을 다시 실행하는 리렌더링은 비용이 많이 드는 작업이다.
따라서 가급적 리렌더링이 빈번하게 발생하지않도록 주의해야한다.
자바스크립트 파싱과 실행
HTML 문서를 파싱한 결과물로 생성된 DOM은 HTML 요소와 스타일등을 변경할 수 있는
DOM API 를 제공한다.
자바스크립트에서 이를 활용하면 이미 생성된 DOM을 동적으로 조작할 수 있다.
script 태그를 만나면 자바스크립트 엔진에게 제어권을 넘기고, 자바스크립트 파싱과 실행이 종료되면 렌더링 엔진으로
다시 제어권을 넘겨 HTML 파싱이 중단된 지점부터 다시 HTML 파싱을 시작해 DOM 생성을 재개한다.
렌더링 엔진이 HTML과 CSS 를 파싱해 DOM 과 CSSOM 을 생성하는 것 처럼
자바스크립트 엔진은 자바스크립트를 해석해 AST(추상적 구문 트리)를 생성한다.
그리고 AST 를 기반으로 인터프리터가 실행할 수 있는 중간코드인 바이트코드를 생성해 실행한다.
토크나이징
자바스크립트 소스코드를 어휘 분석하여 토큰들로 분해한다.
파싱
토큰들의 집합을 구문 분석하여 AST(추상적 구문 트리)를 생성한다.
AST 는 토큰에 문법적 의미와 구조를 반영한 트리 구조의 자료구조이다.
이를 사용하면 Typescript 나 Babel 같은 트랜스파일러를 구현할수도 있다.
위 링크를 이용하면 다양한 자바스크립트 파서를 이용해 AST를 생성해볼수 있다고 하니 참고하자.
바이트코드 생성과 실행
파싱의 결과물로 생성된 AST 는 인터프리터가 실행할 수 있는 중간 코드인 바이트코드로 변환되고
인터프리터에 의해 실행된다.
리플로우와 리페인트
자바스크립트 코드에 DOM 이나 CSSOM을 변경하는 DOM API가 사용된 경우
DOM이나 CSSOM이 변경된다.
이때 변경된 DOM과 CSSOM은 다시 렌더 트리로 결합되고
변경된 렌더트리를 기반으로 레이아웃과 페인트 과정을 거쳐
다시 브라우저 화면에 렌더링하는데, 이를 리플로우, 리페인트라고 한다.
리플로우는 레이아웃 계산을 다시 하는 것을 말하며,
노드 추가나 삭제, 요소 크기/위치 변경, 윈도우 리사이징등 레이아웃에 영향을 주는 변경이 발생한 경우에만 실행된다.
리페인트는 재결합된 렌더 트리를 기반으로 다시 페인트를 하는 것을 말한다.
자바스크립트 파싱에 의한 HTML 파싱 중단
렌더링 엔진과 자바스크립트 엔진은 병렬적으로 파싱을 실행하지않고 직렬적으로 파싱을 수행한다.
이는 script 태그의 위치에 따라 HTML 파싱이 블로킹되어 DOM 생성이 지연될 수 있다는것을 의미한다.
따라서 script 태그의 위치는 중요한 의미를 가진다.
script 태그의 async/defer 어트리뷰트
앞서 말한 자바스크립트 파싱에 의한 DOM 생성 중단 문제를 근본적으로 해결하기 위해
HTML5부터 script 태그에 async 와 defer 어트리뷰트가 추가되었다.
async와 defer 어트리뷰트는 src 어트리뷰트를 통해 외부 자바스크립트 파일을 로드하는 경우에만 사용할 수 있다.
<script async src="extern.js"></script>
<script defer src="extern.js"></script>
async 와 defer 어트리뷰트를 사용하면 HTML 파싱과 외부 자바스크립트 파일의 로드가
비동기적으로 동시에 진행되지만, 자바스크립트의 실행 시점에 차이가 있다.
async 어트리뷰트
자바스크립트의 파싱과 실행은 자바스크립트 파일의 로드가 완료된 직후 진행되며,
이때 HTML 파싱이 중단된다.
여러개의 script 태그에 async 어트리뷰트를 지정하면 script 태그의 순서와는 상관없이
로드가 완료된 자바스크ㅏ립트부터 먼저 실행되어 순서가 보장되지 않는다.
defer 어트리뷰트
자바스크립트의 파싱과 실행은 HTML 파싱이 완료된 직후,
즉 DOM 생성이 완료된 직후(이때 DOMContentLoaded 이벤트 발생) 진행된다.
따라서 DOM 생성이 완료된 이후 실행되어야할 자바스크립트에 유용하다.
'Archive > Develop' 카테고리의 다른 글
[ 모던 자바스크립트 스터디 ] 이벤트 (1) | 2022.11.05 |
---|---|
[ 모던 자바스크립트 스터디 ] DOM (0) | 2022.11.03 |
[ 모던 자바스크립트 스터디 ] Map (0) | 2022.10.31 |
[ 모던 자바스크립트 스터디 ] Set (add, delete, forEach, clear ...) (0) | 2022.10.31 |
[ 모던 자바스크립트 스터디 ] 디스트럭처링 할당 (0) | 2022.10.29 |