모든 개발자를 위한 HTTP 웹 기본 지식
이 글은 김영한님의 모든 개발자를 위한 HTTP 웹 기본 지식 강의를 정리한 내용입니다.
1. 소개
- 웹 개발은 HTTP 기반위에서 개발하는데 언젠가 한번은 정리해야 함
강의 목표
- HTTP 전체 흐름 이해
- 실무에 필요한 핵심 내용
- 쉽게 설명
2. 인터넷 네트워크
인터넷 통신
- 인터넷에서 컴퓨터 둘은 어떻게 통신할까?
IP(인터넷 프로토콜)
- 지정한 IP 주소(IP Address)에 데이터 전달
- 패킷(Packet)이라는 통신 단위로 데이터 전달
- 통신에는 클라이언트와 서버의 IP가 필요하다.
IP 프로토콜의 한계
- 비연결성
- 패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷 전송 -> 받을 수 있는 상태인지 모름
- 비신뢰성
- 중간에 패킷이 사라지면? -> 패킷이 소실되어도 모름
- 패킷이 순서대로 안오면?
- 일반적으로 1.5KB 이상이면 끊어서 보내는데, 메세지의 순서가 다르게 도착해도 모름
- 프로그램 구분
- 같은 IP를 사용하는 서버에서 통신하는 애플리케이션이 둘 이상이면?
TCP, UDP
위 IP 프로토콜의 단점을 TCP가 해결해준다
인터넷 프로토콜 스택의 4계층
- 애플리케이션 계층 - HTTP, FTP
- 전송 계층 - TCP, UDP
- 인터넷 계층 - IP
- 네트워크 인터페이스 계층 - LAN 카드, 드라이버, 장비
- 프로그램이 Hello, world! 메시지 생성 - Application
- SOCKET 라이브러리를 통해 전달 - Application -> OS
- TCP 세그먼트 생성, 메시지 데이터 포함 - OS
- IP 패킷 생성, TCP 데이터 포함 - OS
- 이더넷 프레임 생성(MAC 주소 포함), IP 데이터 포함 - LAN
MAC과 IP
-
MAC(Media Access Control) 주소: 네트워크 카드에 부여된 하드웨어 주소
- 변하지 않는 식별자 (물론 수동으로 변경 가능하지만 일반적으로 고정)
- 로컬 네트워크(LAN)에서만 의미 있음
-
IP(Internet Protocol) 주소: 네트워크 상의 논리 주소
- 동적으로 할당 가능 (예: DHCP)
- 인터넷 또는 내부 네트워크에서 사용
둘은 1:1, 1:N, N:1, N:M등 다양하게 매핑되어 ARP, RARP 프로토콜을 통해 연결되어 있다.
TCP 특징
전송 제어 프로토콜(Transmission Control Protocol)
-
연결지향 - TCP 3 way handshake(가상 연결)
-
SYN: 접속 요청 - 클라이언트 -> 서버
-
SYN + ACK: 서버의 요청 수락 및 클라이언트 접속 요청 - 서버 -> 클라이언트
-
ACK: 클라이언트의 승인(최적화로 함께 데이터 전송) - 클라이언트 -> 서버
- 과거에는 랜선을 직접 꽂아줬다고 하는데(물리적 연결), TCP 연결은 수많은 노드들을 거치지만 가상연결
-
-
데이터 전달 보증
-
순서 보장
- 패킷 순서가 달라지면 달라진 패킷부터 다시 보내달라고 요청 보냄(내부적 최적화가 있을수도)
-
데이터 전달 보증, 순서 보장을 해주기에 신뢰할 수 있는 프로토콜
-
현재는 대부분 TCP 사용
UDP
-
하얀 도화지에 비유(기능이 거의 없음)
-
연결지향 X - TCP 3 way handshake X
-
데이터 전달 보증 X
-
순서 보장 X
-
데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름
-
정리
- IP와 거의 같다. + PORT + 체크섬정도만 추가
- 애플리케이션에서 추가 작업 필요
-
HTTP/3는 UDP 위에서 동작함
-
HTTP/2까지는 TCP위에서 동작하지만 TCP의 한계
- 연결 설정에 3-way handshake 필요 → 느림
- TCP 연결은 OS 커널 레벨에서 관리 → 브라우저/앱에서 자유롭게 개선 불가
- TCP 멀티플렉싱 시 한 패킷 손실이 모든 스트림에 영향을 줌(HOL Blocking)
PORT
- 한번에 둘 이상 연결해야 하면?
- PORT - 같은 IP 내에서 프로세스 구분
- 0 ~ 65535 할당 가능
- 0 ~ 1023: 잘 알려진 포트, 사용하지 않는 것이 좋음
- FTP - 20, 21
- TELNET - 23
- HTTP - 80
- HTTPS - 443
내 로컬에 클라이언트, 서버 둘다 띄우고 통신할 때 HTTP로 통신하지만 당연히 요청이 외부를 거치지는 않는다.
이때는 OS가 주소를 해석하여 localhost
,127.0.0.1
내부라면, 실제 NIC(이더넷, 와이파이 등)를 사용하지 않고,
루프백 인터페이스를 통해 요청 전송하여, 해당 포트로 라우팅 함
DNS
3. URI와 웹 브라우저 요청 흐름
URI
-
URI(Uniform Resource Identifier)
-
"URI는 로케이터(locator), 이름(name) 또는 둘 다 추가로 분류될 수 있다"
-
URI는 자원을 식별하는 문자열
-
URL(Resource Locator): foo://example.com:8042/over/there?name=ferret#nose
- URL - Locator: 리소스가 있는 위치를 지정
- 앞으로 URI를 URL과 같은 의미로 이야기하겠음
-
URN(Resource Name): urn:example:animal:ferret:nose
- URN - Name: 리소스에 이름을 부여
URL
-
scheme://[userinfo@]host[:port][/path][?query][#fragment]
-
프로토콜(https)
- 프로토콜: 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙
-
호스트명(www.google.com)
-
포트 번호(443)
-
path(/search)
- 계층적 구조
-
쿼리 파라미터(q=hello&hl=ko)
- 키 밸류
-
fragment
- html 내부 북마크 등에 사용
- 서버에 전송하는 정보 아님
웹 브라우저 요청 흐름
- HTTP 요청 메세지 생성
- TCP/IP 4계층 따라 메세지 -> 패킷 -> 프레임으로 변환되어 LAN으로 전달
- 전달 받은 서버는 응답 메세지를 생성해 역으로 클라이언트에 전송
4. HTTP 기본
모든 것이 HTTP
-
HTML, TEXT
-
IMAGE, 음성, 영상, 파일
-
JSON, XML (API)
-
거의 모든 형태의 데이터 전송 가능
-
서버간에 데이터를 주고 받을 때도 대부분 HTTP 사용
-
지금은 HTTP 시대!
-
HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더X
-
HTTP/1.0 1996년: 메서드, 헤더 추가
-
HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
- RFC2068 (1997) -> RFC2616 (1999) -> RFC7230~7235 (2014)
-
HTTP/2 2015년: 성능 개선
-
HTTP/3 진행중: TCP 대신에 UDP 사용, 성능 개선
특징
- 클라이언트 서버 구조
- 무상태 프로토콜(스테이스리스), 비연결성
- HTTP 메시지
- 단순함, 확장 가능
클라이언트 서버 구조
- Request Response 구조
- 클라이언트는 서버에 요청을 보내고, 응답을 대기
- 서버가 요청에 대한 결과를 만들어서 응답
Stateful, Stateless
-
서버가 클라이언트의 상태를 보존X
-
장점: 서버 확장성 높음(스케일 아웃)
-
단점: 클라이언트가 추가 데이터 전송
-
상태 유지: 중간에 다른 점원으로 바뀌면 안된다. (중간에 다른 점원으로 바뀔 때 상태 정보를 다른 점원에게 미리 알려줘야 한다.)
-
무상태: 중간에 다른 점원으로 바뀌어도 된다.
- 갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.
- 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
-
무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설 가능 -> 수평 확장(scale out)
실무 한계
- 모든 것을 무상태로 설계 할 수 있는 경우도 있고 없는 경우도 있다.
- 무상태
- 예) 로그인이 필요 없는 단순한 서비스 소개 화면
- 상태 유지
- 예) 로그인
- 로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
- 일반적으로 브라우저 쿠키와 서버 세션등을 사용해서 상태 유지
- JWT가 주류가 된 이유
- 상태 유지는 최소한만 사용
비 연결성(connectionless)
- HTTP는 기본이 연결을 유지하지 않는 모델
- 일반적으로 초 단위의 이하의 빠른 속도로 응답
- 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
- 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
- 서버 자원을 매우 효율적으로 사용할 수 있음
한계와 극복
- TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
- 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지등 수 많은 자원이 함께 다운로드
- 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
- HTTP/2, HTTP/3에서 더 많은 최적화
HTTP 메시지
-
HTTP는 단순하다. 스펙도 읽어볼만...
-
HTTP 메시지도 매우 단순
-
크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술
-
HTTP 메시지에 모든 것을 전송
-
HTTP 역사 HTTP/1.1을 기준으로 학습
-
클라이언트 서버 구조
-
무상태 프로토콜(스테이스리스)
-
HTTP 메시지
-
단순함, 확장 가능
-
지금은 HTTP 시대
상세
- start-line = request-line / status-line
- request-line = method SP(공백) request-target SP HTTP-version CRLF(엔터)
- HTTP 메서드
- 서버가 수행해야 할 동작 지정
- GET: 리소스 조회
- POST: 요청 내역 처리
- 요청 대상 (/search?q=hello&hl=ko)
- HTTP Version
- HTTP 헤더
- header-field = field-name ":" OWS field-value OWS (OWS:띄어쓰기 허용)
- field-name은 대소문자 구문 없음
- HTTP 전송에 필요한 모든 부가정보
- 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보...
- 표준 헤더가 너무 많음(https://en.wikipedia.org/wiki/List_of_HTTP_header_fields)
- 필요시 임의의 헤더 추가 가능
- HTTP body
- 실제 전송할 데이터
- HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능
5. HTTP 메서드
HTTP API를 만들어보자
- restful 네이밍 설명
- 가장 중요한 것은 리소스 식별
API URI 고민
URI(Uniform Resource Identifier)
- 회원을 등록하고 수정하고 조회하는게 리소스가 아니라 회원이라는 개념 자체가 바로 리소스다.
- 회원을 등록하고 수정하고 조회하는 것을 모두 배제 - 동작은 리소스가 아님
- 회원이라는 리소스만 식별하면 된다. -> 회원 리소스를 URI에 매핑
리소스 식별, URI 계층 구조 활용
- 회원 목록 조회
/members
- 회원 조회
/members/{id}
- 회원 등록
/members/{id}
- 회원 수정
/members/{id}
- 회원 삭제
/members/{id}
- 참고: 계층 구조상 상위를 컬렉션으로 보고 복수단어 사용 권장(member -> members)
HTTP 메서드 종류
- GET: 리소스 조회
- POST: 요청 데이터 처리, 주로 등록에 사용
- PUT: 리소스를 대체, 해당 리소스가 없으면 생성
- PATCH: 리소스 부분 변경
- DELETE: 리소스 삭제
HTTP 메서드 - GET, POST
GET
- 리소스 조회
- 서버에 전달하고 싶은 데이터는 query(쿼리 파라미터, 쿼리 스트링)를 통해서 전달
- 메시지 바디를 사용해서 데이터를 전달할 수 있지만, 지원하지 않는 곳이 많아서 권장하지 않음
POST
-
스펙: POST 메서드는 대상 리소스가 리소스의 고유 한 의미 체계에 따라 요청에 포함 된 표현을 처리하도록 요청합니다. (구글 번역)
-
요청 데이터 처리
-
메시지 바디를 통해 서버로 요청 데이터 전달
-
서버는 요청 데이터를 처리
-
메시지 바디를 통해 들어온 데이터를 처리하는 모든 기능을 수행한다.
-
주로 전달된 데이터로 신규 리소스 등록, 프로세스 처리에 사용
-
- 새 리소스 생성(등록): 서버가 아직 식별하지 않은 새 리소스 생성
-
- 요청 데이터 처리
- 단순히 데이터를 생성하거나, 변경하는 것을 넘어서 프로세스를 처리해야 하는 경우
- 예) 주문에서 결제완료 -> 배달시작 -> 배달완료 처럼 단순히 값 변경을 넘어 프로세스의 상태가 변경되는 경우
- POST의 결과로 새로운 리소스가 생성되지 않을 수도 있음
- 예) POST
/orders/{orderId}/start-delivery
(컨트롤 URI)
-
- 다른 메서드로 처리하기 애매한 경우
- 예) JSON으로 조회 데이터를 넘겨야 하는데, GET 메서드를 사용하기 어려운 경우
- 애매하면 POST
HTTP 메서드 - PUT, PATCH, DELETE
PUT
- 리소스를 있으면 대체/없으면 생성
- 클라이언트가 리소스를 식별
- 클라이언트가 리소스 위치를 알고 URI 지정
- POST와 차이점
HTTP 메서드의 속성
-
안전(Safe Methods)
- 호출해도 리소스를 변경하지 않는다.
- Q: 그래도 계속 호출해서, 로그 같은게 쌓여서 장애가 발생하면요?
- A: 안전은 해당 리소스만 고려한다. 그런 부분까지 고려하지 않는다
-
멱등(Idempotent Methods)
- **서버의 상태(state)**가 요청에 의해 변하지 않거나, 결과가 동일한 상태로 유지된다면 멱등하다
- 한 번 호출하든 두 번 호출하든 100번 호출하든 결과가 똑같다
- 멱등은 외부 요인으로 중간에 리소스가 변경되는 것 까지는 고려하지는 않는다.
-
캐시가능(Cacheable Methods)
- 응답 결과 리소스를 캐시해서 사용해도 되는가?
- 실제로는 GET 정도만 캐시로 사용
6. HTTP 메서드 활용
클라이언트에서 서버로 데이터 전송
데이터 전달 방식은 크게 2가지
- 쿼리 파라미터를 통한 데이터 전송
- GET
- 주로 정렬 필터(검색어)
- 메시지 바디를 통한 데이터 전송
- POST, PUT, PATCH
- 회원 가입, 상품 주문, 리소스 등록, 리소스 변경
클라이언트에서 서버로 데이터 전송
4가지 상황
- 정적 데이터 조회
- 이미지, 정적 텍스트 문서
- 동적 데이터 조회
- 주로 검색, 게시판 목록에서 정렬 필터(검색어)
- HTML Form을 통한 데이터 전송
- 회원 가입, 상품 주문, 데이터 변경
- HTTP API를 통한 데이터 전송
- 회원 가입, 상품 주문, 데이터 변경
- 서버 to 서버, 앱 클라이언트, 웹 클라이언트(Ajax)
HTML Form 데이터 전송
- HTML Form submit시 POST 전송 - 회원 가입, 상품 주문, 데이터 변경
- Content-Type: application/x-www-form-urlencoded 사용
- form의 내용을 메시지 바디를 통해서 전송(key=value, 쿼리 파라미터 형식)
- 전송 데이터를 url encoding 처리- abc김 -> abc%EA%B9%80
- HTML Form은 GET 전송도 가능
- Content-Type: multipart/form-data
- 파일 업로드 같은 바이너리 데이터 전송시 사용
- 다른 종류의 여러 파일과 폼의 내용 함께 전송 가능(그래서 이름이 multipart)
- 참고: HTML Form 전송은 GET, POST만 지원
HTTP API 데이터 전송
- 서버 to 서버 - 백엔드 시스템 통신
- 앱 클라이언트 - 아이폰, 안드로이드
- 웹 클라이언트
- HTML에서 Form 전송 대신 자바 스크립트를 통한 통신에 사용(AJAX)
- 예) React, VueJs 같은 웹 클라이언트와 API 통신
- POST, PUT, PATCH: 메시지 바디를 통해 데이터 전송
- GET: 조회, 쿼리 파라미터로 데이터 전달
- Content-Type: application/json을 주로 사용 (사실상 표준)
- TEXT, XML, JSON 등등
HTTP API 설계 예시
- HTTP API - 컬렉션
- POST 기반 등록 - 서버가 리소스 URI 결정
- 예) 회원 관리 API 제공
- HTTP API - 스토어
- PUT 기반 등록 - 클라이언트가 리소스 URI 결정
- 예) 정적 컨텐츠 관리, 원격 파일 관리
- HTML FORM 사용
- 순수 HTML + HTML form 사용
- GET, POST만 지원
- 컨트롤 URI
- GET, POST만 지원하므로 제약이 있음
- 이런 제약을 해결하기 위해 동사로 된 리소스 경로 사용
- POST의 /new, /edit, /delete가 컨트롤 URI
- HTTP 메서드로 해결하기 애매한 경우 사용(HTTP API 포함)
회원 관리 시스템
API 설계 - POST 기반 등록
- 회원 목록
/members
-> GET - 회원 등록
/members
-> POST - 회원 조회
/members/{id}
-> GET - 회원 수정
/members/{id}
-> PATCH, PUT, POST - 회원 삭제
/members/{id}
-> DELETE
POST는 등록 될 자원의 URI를 모르고 PUT은 알아야 함
참고하면 좋은 URI 설계 개념
restful api 설계 개념
- 문서(document)
- 단일 개념(파일 하나, 객체 인스턴스, 데이터베이스 row)
- 예) /members/100, /files/star.jpg
- 컬렉션(collection)
- 서버가 관리하는 리소스 디렉터리
- 서버가 리소스의 URI를 생성하고 관리
- 예) /members
- 스토어(store)
- 클라이언트가 관리하는 자원 저장소
- 클라이언트가 리소스의 URI를 알고 관리
- 예) /files
- 컨트롤러(controller), 컨트롤 URI
- 문서, 컬렉션, 스토어로 해결하기 어려운 추가 프로세스 실행
- 동사를 직접 사용
- 예)
/members/{id}/delete
7. HTTP 상태코드
HTTP 상태코드 소개
-
클라이언트가 보낸 요청의 처리 상태를 응답에서 알려주는 기능
-
비즈니스 에러의 경우 200에 에러메세지를 담아 보냄(데이터독같은 서비스에서 200이 아니면 에러로 나오기 때문)
-
1xx (Informational): 요청이 수신되어 처리중
-
2xx (Successful): 요청 정상 처리
-
3xx (Redirection): 요청을 완료하려면 추가 행동이 필요
-
4xx (Client Error): 클라이언트 오류, 잘못된 문법등으로 서버가 요청을 수행할 수 없음
-
5xx (Server Error): 서버 오류, 서버가 정상 요청을 처리하지 못함
-
클라이언트가 인식할 수 없는 상태코드를 서버가 반환하면 클라이언트는 상위 상태코드로 해석해서 처리
-
299 ??? -> 2xx (Successful)
-
451 ??? -> 4xx (Client Error)
-
599 ??? -> 5xx (Server Error)
2xx - 성공
- 200 OK
- 201 Created - 새로운 리소스가 생성
- 202 Accepted - 요청이 접수되었으나 처리가 완료되지 않았음
- 204 No Content
3xx - 리다이렉션
-
웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 리다이렉트 함
-
301 Moved Permanently
-
302 Found
-
303 See Other
-
304 Not Modified - 캐시
-
307 Temporary Redirect
-
308 Permanent Redirect
영구 리다이렉션 301, 308
- 리소스의 URI가 영구적으로 이동
- 원래의 URL를 사용X, 검색 엔진 등에서도 변경 인지
- 301은 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음(MAY)
- 308은 리다이렉트시 요청 메서드와 본문 유지(처음 POST를 보내면 리다이렉트도 POST 유지)
일시적인 리다이렉션 302, 307, 303
-
리소스의 URI가 일시적으로 변경
-
따라서 검색 엔진 등에서 URL을 변경하면 안됨
-
중복 요청을 방지해야 할 때, redirect 시켜서 막음
-
302 Found -> GET으로 변할 수 있음
-
307 Temporary Redirect -> 메서드가 변하면 안됨
-
303 See Other -> 메서드가 GET으로 변경
-
역사
- 처음 302 스펙의 의도는 HTTP 메서드를 유지하는 것
- 그런데 웹 브라우저들이 대부분 GET으로 바꾸어버림(일부는 다르게 동작)
- 그래서 모호한 302를 대신하는 명확한 307, 303이 등장함(301 대응으로 308도 등장)
-
현실
- 307, 303을 권장하지만 현실적으로 이미 많은 애플리케이션 라이브러리들이 302를 기본값으로 사용
- 자동 리다이렉션시에 GET으로 변해도 되면 그냥 302를 사용해도 큰 문제 없음
4xx - 클라이언트 오류, 5xx - 서버 오류
4xx
- 클라이언트의 요청에 잘못된 문법등으로 서버가 요청을 수행할 수 없음
- 오류의 원인이 클라이언트에 있음
- 중요! 클라이언트가 이미 잘못된 요청, 데이터를 보내고 있기 때문에, 똑같은 재시도가 실패함
400 Bad Request
- 클라이언트가 잘못된 요청을 해서 서버가 요청을 처리할 수 없음
- 요청 구문, 메시지 등등 오류 - 요청 파라미터가 잘못되거나, API 스펙이 맞지 않을 때
- 클라이언트는 요청 내용을 다시 검토하고, 보내야함
401 Unauthorized
클라이언트가 해당 리소스에 대한 인증이 필요함
- 인증(Authentication) 되지 않음
- 401 오류 발생시 응답에 WWW-Authenticate 헤더와 함께 인증 방법을 설명
- 참고
- 인증(Authentication): 본인이 누구인지 확인, (로그인)
- 인가(Authorization): 권한부여 (ADMIN 권한처럼 특정 리소스에 접근할 수 있는 권한, 인증이 있어야 인가가 있음)
- 오류 메시지가 Unauthorized 이지만 인증 되지 않음 (이름이 아쉬움)
403 Forbidden
- 주로 인증 자격 증명은 있지만, 접근 권한이 불충분한 경우
- 어드민 등급이 아닌 사용자가 로그인은 했지만, 어드민 등급의 리소스에 접근하는 경우
404 Not Found
- 요청 리소스가 서버에 없음
- 또는 클라이언트가 권한이 부족한 리소스에 접근할 때 해당 리소스를 숨기고 싶을 때
5xx (Server Error)
- 서버 문제로 오류 발생
- 서버에 문제가 있기 때문에 재시도 하면 성공할 수도 있음(복구가 되거나 등등)
500 Internal Server Error
- 서버 내부 문제로 오류 발생
- 애매하면 500 오류
503 Service Unavailable
- 서버가 일시적인 과부하 또는 예정된 작업으로 잠시 요청을 처리할 수 없음
- Retry-After 헤더 필드로 얼마뒤에 복구되는지 보낼 수도 있음
8. HTTP 헤더1 - 일반 헤더
HTTP 헤더 개요
- header-field = field-name ":" OWS field-value OWS (OWS:띄어쓰기 허용)
- field-name은 대소문자 구문 없음
- HTTP 전송에 필요한 모든 부가정보(메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보...)
- 표준 헤더가 너무 많음
- https://en.wikipedia.org/wiki/List_of_HTTP_header_fields
- 필요시 임의의 헤더 추가 가능
- helloworld: hihi
헤더 분류
-
General 헤더: 메시지 전체에 적용되는 정보, 예) Connection: close
-
Request 헤더: 요청 정보, 예) User-Agent: Mozilla/5.0 (Macintosh; ..)
-
Response 헤더: 응답 정보, 예) Server: Apache
-
Entity 헤더: 엔티티 바디 정보, 예) Content-Type: text/html, Content-Length: 3423
- 메시지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
- 엔티티 본문은 요청이나 응답에서 전달할 실제 데이터
- 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
-
엔티티(Entity) -> 표현(Representation)
-
Representation = representation Metadata + Representation Data
-
표현 = 표현 메타데이터 + 표현 데이터
엔티티 헤더라는 말은 거의 들어본적 없는데 과거에 사용되었던 용어이고 현재는 표현이라 함
- 메시지 본문(message body)을 통해 표현 데이터 전달
- 메시지 본문 = 페이로드(payload)
- 표현은 요청이나 응답에서 전달할 실제 데이터
- 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
표현
- Content-Type: 표현 데이터의 형식
- text/html; charset=utf-8
- application/json
- image/png
- Content-Encoding: 표현 데이터의 압축 방식
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- gzip, deflate, identity
- Content-Language: 표현 데이터의 자연 언어
- Content-Length: 표현 데이터의 길이
- 바이트 단위
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨
- 표현 헤더는 전송, 응답 둘다 사용
콘텐츠 협상
클라이언트가 선호하는 표현 요청
- Accept: 클라이언트가 선호하는 미디어 타입 전달
- Accept-Charset: 클라이언트가 선호하는 문자 인코딩
- Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
- Accept-Language: 클라이언트가 선호하는 자연 언어
- 협상 헤더는 요청시에만 사용
협상 우선순위
-
Quality Values(q) 값 사용
-
0~1, 클수록 높은 우선순위
-
생략하면 1
-
Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
-
구체적인 것이 우선한다.
-
Accept: text/_, text/plain, text/plain;format=flowed, _/*
- text/plain;format=flowed
- text/plain
- text/*
*/*
전송 방식
- 단순 전송
- 압축 전송 - Content-Encoding: gzip
- 분할 전송 - Transfer-Encoding: chunked
- 범위 전송
- 대용량 데이터를 분할해서 각각 개별 범위로 전송
- Range: bytes=1001-2000
- Content-Range: bytes 1001-2000 / 2000
일반 정보
- From: 유저 에이전트의 이메일 정보
- 요청에서 사용
- 일반적으로 잘 사용되지 않음
- 검색 엔진 같은 곳에서, 주로 사용
- Referer: 이전 웹 페이지 주소
- 요청에서 사용
- 현재 요청된 페이지의 이전 웹 페이지 주소
- A -> B로 이동하는 경우 B를 요청할 때 Referer: A 를 포함해서 요청
- Referer를 사용해서 유입 경로 분석 가능
- User-Agent: 유저 에이전트 애플리케이션 정보
- 요청에서 사용
- 클라이언트의 애플리케이션 정보(웹 브라우저 정보, 등등)
- 통계 정보
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- Server: 요청을 처리하는 오리진 서버의 소프트웨어 정보
- 응답에서 사용
- Date: 메시지가 생성된 날짜
- 응답에서 사용
특별한 정보
- Host: 요청한 호스트 정보(도메인)
- 요청에서 사용
- 필수
- 하나의 서버가 여러 도메인을 처리해야 할 때
- 하나의 IP 주소에 여러 도메인이 적용되어 있을 때
- Location: 페이지 리다이렉션
- 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동(리다이렉트)
- 응답코드 3xx에서 설명
- 201 (Created): Location 값은 요청에 의해 생성된 리소스 URI
- 3xx (Redirection): Location 값은 요청을 자동으로 리디렉션하기 위한 대상 리소스를 가리킴
- Allow: 허용 가능한 HTTP 메서드
- 405 (Method Not Allowed) 에서 응답에 포함해야함
- Allow: GET, HEAD, PUT
- Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
- 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
- Retry-After: Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)
- Retry-After: 120 (초단위 표기)
인증
클라이언트 인증 정보를 서버에 전달
- 인증 방식마다 값이 다르다
- Authorization: Basic xxxxxxxxxxxxxxxx
쿠키
- Set-Cookie: 서버에서 클라이언트로 쿠키 전달(응답)
- Cookie: 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
- 사용자 로그인 세션 관리
- 광고 정보 트래킹
- 쿠키 정보는 항상 서버에 전송됨
- 네트워크 트래픽 추가 유발
- 최소한의 정보만 사용(세션 id, 인증 토큰)
- 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage) 참고
- 보안에 민감한 데이터는 저장하면 안됨(주민번호, 신용카드 번호 등등)
- 세션 쿠키: 만료 날짜를 생략하면 브라우저 종료시 까지만 유지
- 영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지
쿠키 - 도메인
- 명시: 명시한 문서 기준 도메인 + 서브 도메인 포함
- domain=example.org를 지정해서 쿠키 생성
- example.org는 물론이고
- dev.example.org도 쿠키 접근
- 생략: 현재 문서 기준 도메인만 적용
- example.org 에서 쿠키를 생성하고 domain 지정을 생략
- example.org 에서만 쿠키 접근
- dev.example.org는 쿠키 미접근
쿠키 - 경로
- 이 경로를 포함한 하위 경로 페이지만 쿠키 접근 - path=/home
- 일반적으로 path=/ 루트로 지정
- path=/home 지정
- /home -> 가능
- /home/level1 -> 가능
- /home/level1/level2 -> 가능
- /hello -> 불가능
쿠키 - 보안
- Secure
- 쿠키는 http, https를 구분하지 않고 전송
- Secure를 적용하면 https인 경우에만 전송
- HttpOnly
- XSS 공격 방지
- 자바스크립트에서 접근 불가(document.cookie)
- HTTP 전송에만 사용
- SameSite - 나름 최신
- XSRF 공격 방지
- 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송
9. HTTP 헤더2 - 캐시와 조건부 요청
캐시 기본 동작
캐시가 없으면 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운로드 받아야 한다.
- 인터넷 네트워크는 상대적으로 매우 느리고 비싸다.
- 로딩 속도가 느림, 느린 사용자 경험
캐시 적용 시 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다.
- 비싼 네트워크 사용량을 줄일 수 있다.
- 상대적으로 로딩 속도가 매우 빠르다, 빠른 사용자 경험
검증 헤더와 조건부 요청1
- 캐시 유효 시간이 초과해서 서버에 다시 요청하면 다음 두 가지 상황이 나타난다.
- 서버에서 기존 데이터를 변경함 -> 새로 받아야 함
- 서버에서 기존 데이터를 변경하지 않음
-
데이터가 같다는 사실을 확인하면 캐시를 재사용 할 수 있다.
-
검증 헤더는 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터를 담는 헤더이다.
-
검증 헤더로 조건에 따른 분기
-
Last-Modified, ETag
-
If-Modified-Since: Last-Modified 사용
-
If-None-Match: ETag 사용
-
조건이 만족하면 200 OK
-
조건이 만족하지 않으면 304 Not Modified
검증헤더 Last-Modified
-
응답 메세지에 검증헤더 추가
Last-Modified: 2020년 11월 10일 10:00:00
-
해당 리소스의 요청헤더에
if-modified-since: 2020년 11월 10일 10:00:00
자동 추가 -> 응답에는 304 및 body 없음- 캐시 유효 시간이 초과해도, 서버의 데이터가 갱신되지 않으면
- 304 Not Modified + 헤더 메타 정보만 응답(바디X)
- 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
- 클라이언트는 캐시에 저장되어 있는 데이터 재활용
- 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드
-
Nginx는 정적 파일 서빙 시 기본적으로 **파일 시스템의 mtime(수정 시간)**을 보고 Last-Modified 헤더를 자동으로 응답에 추가한다 함
검증 헤더와 조건부 요청2
Last-Modified, If-Modified-Since 단점
- 1초 미만(0.x초) 단위로 캐시 조정이 불가능
- 날짜 기반의 로직 사용
- 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우
- 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
- 예) 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우
ETag
- ETag(Entity Tag)
- 캐시용 데이터에 임의의 고유한 버전 이름을 달아둠
- 예) ETag: "v1.0", ETag: "a2jiodwjekjl3"
- 데이터가 변경되면 이 이름을 바꾸어서 변경함(Hash를 다시 생성)
- 예) ETag: "aaaaa" -> ETag: "bbbbb"
- 진짜 단순하게 ETag만 보내서 같으면 유지, 다르면 다시 받기!
- 캐시 제어 로직을 서버에서 완전히 관리, 클라이언트는 단순히 이 값을 서버에 제공(클라이언트는 캐시 메커니즘을 모름)
- 서버는 배타 오픈 기간인 3일 동안 파일이 변경되어도 ETag를 동일하게 유지
- 애플리케이션 배포 주기에 맞추어 ETag 모두 갱신
캐시와 조건부 요청 헤더
캐시 제어 헤더
- Cache-Control: 캐시 제어
max-age
: 캐시 유효 시간, 초 단위no-cache
: 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용no-store
: 데이터에 민감한 정보가 있으므로 저장하면 안됨
- Pragma: 캐시 제어(하위 호환) - HTTP 1.0 하위 호환
- Expires: 캐시 유효 기간(하위 호환) - 캐시 만료일 지정
- 지금은 더 유연한 Cache-Control: max-age 권장
- Cache-Control: max-age와 함께 사용하면 Expires는 무시
프록시 캐시
- 원서버 - 프록시 캐시 서버 - 클라이언트
- 속도 향상을 위해 컨텐츠를 사용자와 물리적으로 가까운 프록시 캐시 서버에서 반환하게 동작
- Cache-Control:
- public: public 캐시에 저장되어도 됨
- private: 응답이 해당 사용자만을 위한 것임, private 캐시에 저장해야 함(기본값)
- s-maxage: 프록시 캐시에만 적용되는 max-age
- Age: 60 (HTTP 헤더): 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)
캐시 무효화
- Cache-Control: no-cache, no-store, must-revalidate
- 내가 알기론
no-store
만 써도 된다
- 내가 알기론