모든 개발자를 위한 HTTP 웹 기본 지식

이 글은 김영한님의 모든 개발자를 위한 HTTP 웹 기본 지식 강의를 정리한 내용입니다.

1. 소개

웹 개발은 HTTP 기반위에서 개발하는데 언젠가 한번은 정리해야 함

강의 목표

HTTP 전체 흐름 이해
실무에 필요한 핵심 내용
쉽게 설명

2. 인터넷 네트워크

인터넷 통신

인터넷에서 컴퓨터 둘은 어떻게 통신할까?

IP(인터넷 프로토콜)

지정한 IP 주소(IP Address)에 데이터 전달
패킷(Packet)이라는 통신 단위로 데이터 전달
통신에는 클라이언트와 서버의 IP가 필요하다.

IP 프로토콜의 한계

비연결성
- 패킷을 받을 대상이 없거나 서비스 불능 상태여도 패킷 전송 -> 받을 수 있는 상태인지 모름
비신뢰성
- 중간에 패킷이 사라지면? -> 패킷이 소실되어도 모름
- 패킷이 순서대로 안오면?
  - 일반적으로 1.5KB 이상이면 끊어서 보내는데, 메세지의 순서가 다르게 도착해도 모름
프로그램 구분
- 같은 IP를 사용하는 서버에서 통신하는 애플리케이션이 둘 이상이면?

TCP, UDP

위 IP 프로토콜의 단점을 TCP가 해결해준다

인터넷 프로토콜 스택의 4계층

애플리케이션 계층 - HTTP, FTP
전송 계층 - TCP, UDP
인터넷 계층 - IP
네트워크 인터페이스 계층 - LAN 카드, 드라이버, 장비

프로그램이 Hello, world! 메시지 생성 - Application
SOCKET 라이브러리를 통해 전달 - Application -> OS
TCP 세그먼트 생성, 메시지 데이터 포함 - OS
IP 패킷 생성, TCP 데이터 포함 - OS
이더넷 프레임 생성(MAC 주소 포함), IP 데이터 포함 - LAN

MAC과 IP

MAC(Media Access Control) 주소: 네트워크 카드에 부여된 하드웨어 주소
- 변하지 않는 식별자 (물론 수동으로 변경 가능하지만 일반적으로 고정)
- 로컬 네트워크(LAN)에서만 의미 있음
IP(Internet Protocol) 주소: 네트워크 상의 논리 주소
- 동적으로 할당 가능 (예: DHCP)
- 인터넷 또는 내부 네트워크에서 사용

둘은 1:1, 1:N, N:1, N:M등 다양하게 매핑되어 ARP, RARP 프로토콜을 통해 연결되어 있다.

TCP 특징

전송 제어 프로토콜(Transmission Control Protocol)

연결지향 - TCP 3 way handshake(가상 연결)
1. SYN: 접속 요청 - 클라이언트 -> 서버
2. SYN + ACK: 서버의 요청 수락 및 클라이언트 접속 요청 - 서버 -> 클라이언트
3. ACK: 클라이언트의 승인(최적화로 함께 데이터 전송) - 클라이언트 -> 서버
- 과거에는 랜선을 직접 꽂아줬다고 하는데(물리적 연결), TCP 연결은 수많은 노드들을 거치지만 가상연결
데이터 전달 보증
순서 보장
- 패킷 순서가 달라지면 달라진 패킷부터 다시 보내달라고 요청 보냄(내부적 최적화가 있을수도)
데이터 전달 보증, 순서 보장을 해주기에 신뢰할 수 있는 프로토콜
현재는 대부분 TCP 사용

UDP

하얀 도화지에 비유(기능이 거의 없음)
연결지향 X - TCP 3 way handshake X
데이터 전달 보증 X
순서 보장 X
데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름
정리
- IP와 거의 같다. + PORT + 체크섬정도만 추가
- 애플리케이션에서 추가 작업 필요
HTTP/3는 UDP 위에서 동작함
HTTP/2까지는 TCP위에서 동작하지만 TCP의 한계
- 연결 설정에 3-way handshake 필요 → 느림
- TCP 연결은 OS 커널 레벨에서 관리 → 브라우저/앱에서 자유롭게 개선 불가
- TCP 멀티플렉싱 시 한 패킷 손실이 모든 스트림에 영향을 줌(HOL Blocking)

PORT

한번에 둘 이상 연결해야 하면?
PORT - 같은 IP 내에서 프로세스 구분
0 ~ 65535 할당 가능
0 ~ 1023: 잘 알려진 포트, 사용하지 않는 것이 좋음
- FTP - 20, 21
- TELNET - 23
- HTTP - 80
- HTTPS - 443

내 로컬에 클라이언트, 서버 둘다 띄우고 통신할 때 HTTP로 통신하지만 당연히 요청이 외부를 거치지는 않는다. 이때는 OS가 주소를 해석하여 localhost,127.0.0.1 내부라면, 실제 NIC(이더넷, 와이파이 등)를 사용하지 않고, 루프백 인터페이스를 통해 요청 전송하여, 해당 포트로 라우팅 함

DNS

3. URI와 웹 브라우저 요청 흐름

URI

URI(Uniform Resource Identifier)
"URI는 로케이터(locator), 이름(name) 또는 둘 다 추가로 분류될 수 있다"
URI는 자원을 식별하는 문자열
URL(Resource Locator): foo://example.com:8042/over/there?name=ferret#nose
- URL - Locator: 리소스가 있는 위치를 지정
- 앞으로 URI를 URL과 같은 의미로 이야기하겠음
URN(Resource Name): urn:example:animal:ferret:nose
- URN - Name: 리소스에 이름을 부여

URL

scheme://[userinfo@]host[:port][/path][?query][#fragment]
https://www.google.com:443/search?q=hello&hl=ko
프로토콜(https)
- 프로토콜: 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙
호스트명(www.google.com)
포트 번호(443)
path(/search)
- 계층적 구조
쿼리 파라미터(q=hello&hl=ko)
- 키 밸류
fragment
- html 내부 북마크 등에 사용
- 서버에 전송하는 정보 아님

웹 브라우저 요청 흐름

HTTP 요청 메세지 생성
TCP/IP 4계층 따라 메세지 -> 패킷 -> 프레임으로 변환되어 LAN으로 전달
전달 받은 서버는 응답 메세지를 생성해 역으로 클라이언트에 전송

4. HTTP 기본

모든 것이 HTTP

HTML, TEXT
IMAGE, 음성, 영상, 파일
JSON, XML (API)
거의 모든 형태의 데이터 전송 가능
서버간에 데이터를 주고 받을 때도 대부분 HTTP 사용
지금은 HTTP 시대!
HTTP/0.9 1991년: GET 메서드만 지원, HTTP 헤더X
HTTP/1.0 1996년: 메서드, 헤더 추가
HTTP/1.1 1997년: 가장 많이 사용, 우리에게 가장 중요한 버전
- RFC2068 (1997) -> RFC2616 (1999) -> RFC7230~7235 (2014)
HTTP/2 2015년: 성능 개선
HTTP/3 진행중: TCP 대신에 UDP 사용, 성능 개선

특징

클라이언트 서버 구조
무상태 프로토콜(스테이스리스), 비연결성
HTTP 메시지
단순함, 확장 가능

클라이언트 서버 구조

Request Response 구조
클라이언트는 서버에 요청을 보내고, 응답을 대기
서버가 요청에 대한 결과를 만들어서 응답

Stateful, Stateless

서버가 클라이언트의 상태를 보존X
장점: 서버 확장성 높음(스케일 아웃)
단점: 클라이언트가 추가 데이터 전송
상태 유지: 중간에 다른 점원으로 바뀌면 안된다. (중간에 다른 점원으로 바뀔 때 상태 정보를 다른 점원에게 미리 알려줘야 한다.)
무상태: 중간에 다른 점원으로 바뀌어도 된다.
- 갑자기 고객이 증가해도 점원을 대거 투입할 수 있다.
- 갑자기 클라이언트 요청이 증가해도 서버를 대거 투입할 수 있다.
무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설 가능 -> 수평 확장(scale out)

실무 한계

모든 것을 무상태로 설계 할 수 있는 경우도 있고 없는 경우도 있다.
무상태
- 예) 로그인이 필요 없는 단순한 서비스 소개 화면
상태 유지
- 예) 로그인
로그인한 사용자의 경우 로그인 했다는 상태를 서버에 유지
일반적으로 브라우저 쿠키와 서버 세션등을 사용해서 상태 유지
- JWT가 주류가 된 이유
상태 유지는 최소한만 사용

비 연결성(connectionless)

HTTP는 기본이 연결을 유지하지 않는 모델
일반적으로 초 단위의 이하의 빠른 속도로 응답
1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
- 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
서버 자원을 매우 효율적으로 사용할 수 있음

한계와 극복

TCP/IP 연결을 새로 맺어야 함 - 3 way handshake 시간 추가
웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지등 수 많은 자원이 함께 다운로드
지금은 HTTP 지속 연결(Persistent Connections)로 문제 해결
HTTP/2, HTTP/3에서 더 많은 최적화

HTTP 메시지

HTTP는 단순하다. 스펙도 읽어볼만...
HTTP 메시지도 매우 단순
크게 성공하는 표준 기술은 단순하지만 확장 가능한 기술
HTTP 메시지에 모든 것을 전송
HTTP 역사 HTTP/1.1을 기준으로 학습
클라이언트 서버 구조
무상태 프로토콜(스테이스리스)
HTTP 메시지
단순함, 확장 가능
지금은 HTTP 시대

상세

start-line = request-line / status-line
- request-line = method SP(공백) request-target SP HTTP-version CRLF(엔터)
- HTTP 메서드
  - 서버가 수행해야 할 동작 지정
  - GET: 리소스 조회
  - POST: 요청 내역 처리
- 요청 대상 (/search?q=hello&hl=ko)
- HTTP Version
HTTP 헤더
- header-field = field-name ":" OWS field-value OWS (OWS:띄어쓰기 허용)
- field-name은 대소문자 구문 없음
- HTTP 전송에 필요한 모든 부가정보
  - 예) 메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트(브라우저) 정보, 서버 애플리케이션 정보, 캐시 관리 정보...
- 표준 헤더가 너무 많음(https://en.wikipedia.org/wiki/List_of_HTTP_header_fields)
- 필요시 임의의 헤더 추가 가능
HTTP body
- 실제 전송할 데이터
- HTML 문서, 이미지, 영상, JSON 등등 byte로 표현할 수 있는 모든 데이터 전송 가능

5. HTTP 메서드

HTTP API를 만들어보자

restful 네이밍 설명
가장 중요한 것은 리소스 식별

API URI 고민

URI(Uniform Resource Identifier)

회원을 등록하고 수정하고 조회하는게 리소스가 아니라 회원이라는 개념 자체가 바로 리소스다.
회원을 등록하고 수정하고 조회하는 것을 모두 배제 - 동작은 리소스가 아님
회원이라는 리소스만 식별하면 된다. -> 회원 리소스를 URI에 매핑

리소스 식별, URI 계층 구조 활용

회원 목록 조회 /members
회원 조회 /members/{id}
회원 등록 /members/{id}
회원 수정 /members/{id}
회원 삭제 /members/{id}
참고: 계층 구조상 상위를 컬렉션으로 보고 복수단어 사용 권장(member -> members)

HTTP 메서드 종류

GET: 리소스 조회
POST: 요청 데이터 처리, 주로 등록에 사용
PUT: 리소스를 대체, 해당 리소스가 없으면 생성
PATCH: 리소스 부분 변경
DELETE: 리소스 삭제

HTTP 메서드 - GET, POST

GET

리소스 조회
서버에 전달하고 싶은 데이터는 query(쿼리 파라미터, 쿼리 스트링)를 통해서 전달
메시지 바디를 사용해서 데이터를 전달할 수 있지만, 지원하지 않는 곳이 많아서 권장하지 않음

POST

스펙: POST 메서드는 대상 리소스가 리소스의 고유 한 의미 체계에 따라 요청에 포함 된 표현을 처리하도록 요청합니다. (구글 번역)
요청 데이터 처리
메시지 바디를 통해 서버로 요청 데이터 전달
서버는 요청 데이터를 처리
메시지 바디를 통해 들어온 데이터를 처리하는 모든 기능을 수행한다.
주로 전달된 데이터로 신규 리소스 등록, 프로세스 처리에 사용
1. 새 리소스 생성(등록): 서버가 아직 식별하지 않은 새 리소스 생성
1. 요청 데이터 처리
- 단순히 데이터를 생성하거나, 변경하는 것을 넘어서 프로세스를 처리해야 하는 경우
- 예) 주문에서 결제완료 -> 배달시작 -> 배달완료 처럼 단순히 값 변경을 넘어 프로세스의 상태가 변경되는 경우
- POST의 결과로 새로운 리소스가 생성되지 않을 수도 있음
- 예) POST /orders/{orderId}/start-delivery (컨트롤 URI)
1. 다른 메서드로 처리하기 애매한 경우
- 예) JSON으로 조회 데이터를 넘겨야 하는데, GET 메서드를 사용하기 어려운 경우
- 애매하면 POST

HTTP 메서드 - PUT, PATCH, DELETE

PUT

리소스를 있으면 대체/없으면 생성
클라이언트가 리소스를 식별
- 클라이언트가 리소스 위치를 알고 URI 지정
- POST와 차이점

HTTP 메서드의 속성

안전(Safe Methods)
- 호출해도 리소스를 변경하지 않는다.
- Q: 그래도 계속 호출해서, 로그 같은게 쌓여서 장애가 발생하면요?
- A: 안전은 해당 리소스만 고려한다. 그런 부분까지 고려하지 않는다
멱등(Idempotent Methods)
- **서버의 상태(state)**가 요청에 의해 변하지 않거나, 결과가 동일한 상태로 유지된다면 멱등하다
- 한 번 호출하든 두 번 호출하든 100번 호출하든 결과가 똑같다
- 멱등은 외부 요인으로 중간에 리소스가 변경되는 것 까지는 고려하지는 않는다.
캐시가능(Cacheable Methods)
- 응답 결과 리소스를 캐시해서 사용해도 되는가?
- 실제로는 GET 정도만 캐시로 사용

6. HTTP 메서드 활용

클라이언트에서 서버로 데이터 전송

데이터 전달 방식은 크게 2가지

쿼리 파라미터를 통한 데이터 전송
- GET
- 주로 정렬 필터(검색어)
메시지 바디를 통한 데이터 전송
- POST, PUT, PATCH
- 회원 가입, 상품 주문, 리소스 등록, 리소스 변경

클라이언트에서 서버로 데이터 전송

4가지 상황

정적 데이터 조회
- 이미지, 정적 텍스트 문서
동적 데이터 조회
- 주로 검색, 게시판 목록에서 정렬 필터(검색어)
HTML Form을 통한 데이터 전송
- 회원 가입, 상품 주문, 데이터 변경
HTTP API를 통한 데이터 전송
- 회원 가입, 상품 주문, 데이터 변경
- 서버 to 서버, 앱 클라이언트, 웹 클라이언트(Ajax)

HTML Form 데이터 전송

HTML Form submit시 POST 전송 - 회원 가입, 상품 주문, 데이터 변경
Content-Type: application/x-www-form-urlencoded 사용
- form의 내용을 메시지 바디를 통해서 전송(key=value, 쿼리 파라미터 형식)
- 전송 데이터를 url encoding 처리- abc김 -> abc%EA%B9%80
HTML Form은 GET 전송도 가능
Content-Type: multipart/form-data
파일 업로드 같은 바이너리 데이터 전송시 사용
다른 종류의 여러 파일과 폼의 내용 함께 전송 가능(그래서 이름이 multipart)
참고: HTML Form 전송은 GET, POST만 지원

HTTP API 데이터 전송

서버 to 서버 - 백엔드 시스템 통신
앱 클라이언트 - 아이폰, 안드로이드
웹 클라이언트
- HTML에서 Form 전송 대신 자바 스크립트를 통한 통신에 사용(AJAX)
- 예) React, VueJs 같은 웹 클라이언트와 API 통신
POST, PUT, PATCH: 메시지 바디를 통해 데이터 전송
GET: 조회, 쿼리 파라미터로 데이터 전달
Content-Type: application/json을 주로 사용 (사실상 표준)
- TEXT, XML, JSON 등등

HTTP API 설계 예시

HTTP API - 컬렉션
- POST 기반 등록 - 서버가 리소스 URI 결정
- 예) 회원 관리 API 제공
HTTP API - 스토어
- PUT 기반 등록 - 클라이언트가 리소스 URI 결정
- 예) 정적 컨텐츠 관리, 원격 파일 관리
HTML FORM 사용
- 순수 HTML + HTML form 사용
- GET, POST만 지원
- 컨트롤 URI
  - GET, POST만 지원하므로 제약이 있음
  - 이런 제약을 해결하기 위해 동사로 된 리소스 경로 사용
  - POST의 /new, /edit, /delete가 컨트롤 URI
  - HTTP 메서드로 해결하기 애매한 경우 사용(HTTP API 포함)

회원 관리 시스템

API 설계 - POST 기반 등록

회원 목록 /members -> GET
회원 등록 /members -> POST
회원 조회 /members/{id} -> GET
회원 수정 /members/{id} -> PATCH, PUT, POST
회원 삭제 /members/{id} -> DELETE

POST는 등록 될 자원의 URI를 모르고 PUT은 알아야 함

참고하면 좋은 URI 설계 개념

restful api 설계 개념

문서(document)
- 단일 개념(파일 하나, 객체 인스턴스, 데이터베이스 row)
- 예) /members/100, /files/star.jpg
컬렉션(collection)
- 서버가 관리하는 리소스 디렉터리
- 서버가 리소스의 URI를 생성하고 관리
- 예) /members
스토어(store)
- 클라이언트가 관리하는 자원 저장소
- 클라이언트가 리소스의 URI를 알고 관리
- 예) /files
컨트롤러(controller), 컨트롤 URI
- 문서, 컬렉션, 스토어로 해결하기 어려운 추가 프로세스 실행
- 동사를 직접 사용
- 예) /members/{id}/delete

7. HTTP 상태코드

HTTP 상태코드 소개

클라이언트가 보낸 요청의 처리 상태를 응답에서 알려주는 기능
비즈니스 에러의 경우 200에 에러메세지를 담아 보냄(데이터독같은 서비스에서 200이 아니면 에러로 나오기 때문)
1xx (Informational): 요청이 수신되어 처리중
2xx (Successful): 요청 정상 처리
3xx (Redirection): 요청을 완료하려면 추가 행동이 필요
4xx (Client Error): 클라이언트 오류, 잘못된 문법등으로 서버가 요청을 수행할 수 없음
5xx (Server Error): 서버 오류, 서버가 정상 요청을 처리하지 못함
클라이언트가 인식할 수 없는 상태코드를 서버가 반환하면 클라이언트는 상위 상태코드로 해석해서 처리
299 ??? -> 2xx (Successful)
451 ??? -> 4xx (Client Error)
599 ??? -> 5xx (Server Error)

2xx - 성공

200 OK
201 Created - 새로운 리소스가 생성
202 Accepted - 요청이 접수되었으나 처리가 완료되지 않았음
204 No Content

3xx - 리다이렉션

웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 리다이렉트 함
301 Moved Permanently
302 Found
303 See Other
304 Not Modified - 캐시
307 Temporary Redirect
308 Permanent Redirect

영구 리다이렉션 301, 308

리소스의 URI가 영구적으로 이동
원래의 URL를 사용X, 검색 엔진 등에서도 변경 인지
301은 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음(MAY)
308은 리다이렉트시 요청 메서드와 본문 유지(처음 POST를 보내면 리다이렉트도 POST 유지)

일시적인 리다이렉션 302, 307, 303

리소스의 URI가 일시적으로 변경
따라서 검색 엔진 등에서 URL을 변경하면 안됨
중복 요청을 방지해야 할 때, redirect 시켜서 막음
302 Found -> GET으로 변할 수 있음
307 Temporary Redirect -> 메서드가 변하면 안됨
303 See Other -> 메서드가 GET으로 변경
역사
- 처음 302 스펙의 의도는 HTTP 메서드를 유지하는 것
- 그런데 웹 브라우저들이 대부분 GET으로 바꾸어버림(일부는 다르게 동작)
- 그래서 모호한 302를 대신하는 명확한 307, 303이 등장함(301 대응으로 308도 등장)
현실
- 307, 303을 권장하지만 현실적으로 이미 많은 애플리케이션 라이브러리들이 302를 기본값으로 사용
- 자동 리다이렉션시에 GET으로 변해도 되면 그냥 302를 사용해도 큰 문제 없음

4xx - 클라이언트 오류, 5xx - 서버 오류

4xx

클라이언트의 요청에 잘못된 문법등으로 서버가 요청을 수행할 수 없음
오류의 원인이 클라이언트에 있음
중요! 클라이언트가 이미 잘못된 요청, 데이터를 보내고 있기 때문에, 똑같은 재시도가 실패함

400 Bad Request

클라이언트가 잘못된 요청을 해서 서버가 요청을 처리할 수 없음
요청 구문, 메시지 등등 오류 - 요청 파라미터가 잘못되거나, API 스펙이 맞지 않을 때
클라이언트는 요청 내용을 다시 검토하고, 보내야함

401 Unauthorized

클라이언트가 해당 리소스에 대한 인증이 필요함

인증(Authentication) 되지 않음
401 오류 발생시 응답에 WWW-Authenticate 헤더와 함께 인증 방법을 설명
참고
- 인증(Authentication): 본인이 누구인지 확인, (로그인)
- 인가(Authorization): 권한부여 (ADMIN 권한처럼 특정 리소스에 접근할 수 있는 권한, 인증이 있어야 인가가 있음)
- 오류 메시지가 Unauthorized 이지만 인증 되지 않음 (이름이 아쉬움)

403 Forbidden

주로 인증 자격 증명은 있지만, 접근 권한이 불충분한 경우
어드민 등급이 아닌 사용자가 로그인은 했지만, 어드민 등급의 리소스에 접근하는 경우

404 Not Found

요청 리소스가 서버에 없음
또는 클라이언트가 권한이 부족한 리소스에 접근할 때 해당 리소스를 숨기고 싶을 때

5xx (Server Error)

서버 문제로 오류 발생
서버에 문제가 있기 때문에 재시도 하면 성공할 수도 있음(복구가 되거나 등등)

500 Internal Server Error

서버 내부 문제로 오류 발생
애매하면 500 오류

503 Service Unavailable

서버가 일시적인 과부하 또는 예정된 작업으로 잠시 요청을 처리할 수 없음
Retry-After 헤더 필드로 얼마뒤에 복구되는지 보낼 수도 있음

8. HTTP 헤더1 - 일반 헤더

HTTP 헤더 개요

header-field = field-name ":" OWS field-value OWS (OWS:띄어쓰기 허용)
field-name은 대소문자 구문 없음
HTTP 전송에 필요한 모든 부가정보(메시지 바디의 내용, 메시지 바디의 크기, 압축, 인증, 요청 클라이언트, 서버 정보, 캐시 관리 정보...)
표준 헤더가 너무 많음
https://en.wikipedia.org/wiki/List_of_HTTP_header_fields
필요시 임의의 헤더 추가 가능
helloworld: hihi

헤더 분류

General 헤더: 메시지 전체에 적용되는 정보, 예) Connection: close
Request 헤더: 요청 정보, 예) User-Agent: Mozilla/5.0 (Macintosh; ..)
Response 헤더: 응답 정보, 예) Server: Apache
Entity 헤더: 엔티티 바디 정보, 예) Content-Type: text/html, Content-Length: 3423
- 메시지 본문(message body)은 엔티티 본문(entity body)을 전달하는데 사용
- 엔티티 본문은 요청이나 응답에서 전달할 실제 데이터
- 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보 제공
- 데이터 유형(html, json), 데이터 길이, 압축 정보 등등
엔티티(Entity) -> 표현(Representation)
Representation = representation Metadata + Representation Data
표현 = 표현 메타데이터 + 표현 데이터

엔티티 헤더라는 말은 거의 들어본적 없는데 과거에 사용되었던 용어이고 현재는 표현이라 함

메시지 본문(message body)을 통해 표현 데이터 전달
메시지 본문 = 페이로드(payload)
표현은 요청이나 응답에서 전달할 실제 데이터
표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
데이터 유형(html, json), 데이터 길이, 압축 정보 등등

표현

Content-Type: 표현 데이터의 형식
- text/html; charset=utf-8
- application/json
- image/png
Content-Encoding: 표현 데이터의 압축 방식
- 데이터를 전달하는 곳에서 압축 후 인코딩 헤더 추가
- 데이터를 읽는 쪽에서 인코딩 헤더의 정보로 압축 해제
- gzip, deflate, identity
Content-Language: 표현 데이터의 자연 언어
Content-Length: 표현 데이터의 길이
- 바이트 단위
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨
표현 헤더는 전송, 응답 둘다 사용

콘텐츠 협상

클라이언트가 선호하는 표현 요청

Accept: 클라이언트가 선호하는 미디어 타입 전달
Accept-Charset: 클라이언트가 선호하는 문자 인코딩
Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
Accept-Language: 클라이언트가 선호하는 자연 언어
협상 헤더는 요청시에만 사용

협상 우선순위

Quality Values(q) 값 사용
0~1, 클수록 높은 우선순위
생략하면 1
Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
구체적인 것이 우선한다.
Accept: text/_, text/plain, text/plain;format=flowed, _/*
1. text/plain;format=flowed
2. text/plain
3. text/*
4. */*

전송 방식

단순 전송
압축 전송 - Content-Encoding: gzip
분할 전송 - Transfer-Encoding: chunked
범위 전송
- 대용량 데이터를 분할해서 각각 개별 범위로 전송
- Range: bytes=1001-2000
- Content-Range: bytes 1001-2000 / 2000

일반 정보

From: 유저 에이전트의 이메일 정보
- 요청에서 사용
- 일반적으로 잘 사용되지 않음
- 검색 엔진 같은 곳에서, 주로 사용
Referer: 이전 웹 페이지 주소
- 요청에서 사용
- 현재 요청된 페이지의 이전 웹 페이지 주소
- A -> B로 이동하는 경우 B를 요청할 때 Referer: A 를 포함해서 요청
- Referer를 사용해서 유입 경로 분석 가능
User-Agent: 유저 에이전트 애플리케이션 정보
- 요청에서 사용
- 클라이언트의 애플리케이션 정보(웹 브라우저 정보, 등등)
- 통계 정보
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
Server: 요청을 처리하는 오리진 서버의 소프트웨어 정보
- 응답에서 사용
Date: 메시지가 생성된 날짜
- 응답에서 사용

특별한 정보

Host: 요청한 호스트 정보(도메인)
- 요청에서 사용
- 필수
- 하나의 서버가 여러 도메인을 처리해야 할 때
- 하나의 IP 주소에 여러 도메인이 적용되어 있을 때
Location: 페이지 리다이렉션
- 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동(리다이렉트)
- 응답코드 3xx에서 설명
- 201 (Created): Location 값은 요청에 의해 생성된 리소스 URI
- 3xx (Redirection): Location 값은 요청을 자동으로 리디렉션하기 위한 대상 리소스를 가리킴
Allow: 허용 가능한 HTTP 메서드
- 405 (Method Not Allowed) 에서 응답에 포함해야함
- Allow: GET, HEAD, PUT
Retry-After: 유저 에이전트가 다음 요청을 하기까지 기다려야 하는 시간
- 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
- Retry-After: Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)
- Retry-After: 120 (초단위 표기)

인증

클라이언트 인증 정보를 서버에 전달

인증 방식마다 값이 다르다
Authorization: Basic xxxxxxxxxxxxxxxx

쿠키

Set-Cookie: 서버에서 클라이언트로 쿠키 전달(응답)
Cookie: 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
- 사용자 로그인 세션 관리
- 광고 정보 트래킹
쿠키 정보는 항상 서버에 전송됨
- 네트워크 트래픽 추가 유발
- 최소한의 정보만 사용(세션 id, 인증 토큰)
- 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage) 참고
보안에 민감한 데이터는 저장하면 안됨(주민번호, 신용카드 번호 등등)
세션 쿠키: 만료 날짜를 생략하면 브라우저 종료시 까지만 유지
영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지

쿠키 - 도메인

명시: 명시한 문서 기준 도메인 + 서브 도메인 포함
- domain=example.org를 지정해서 쿠키 생성
- example.org는 물론이고
- dev.example.org도 쿠키 접근
생략: 현재 문서 기준 도메인만 적용
- example.org 에서 쿠키를 생성하고 domain 지정을 생략
- example.org 에서만 쿠키 접근
- dev.example.org는 쿠키 미접근

쿠키 - 경로

이 경로를 포함한 하위 경로 페이지만 쿠키 접근 - path=/home
일반적으로 path=/ 루트로 지정
- path=/home 지정
- /home -> 가능
- /home/level1 -> 가능
- /home/level1/level2 -> 가능
- /hello -> 불가능

쿠키 - 보안

Secure
- 쿠키는 http, https를 구분하지 않고 전송
- Secure를 적용하면 https인 경우에만 전송
HttpOnly
- XSS 공격 방지
- 자바스크립트에서 접근 불가(document.cookie)
- HTTP 전송에만 사용
SameSite - 나름 최신
- XSRF 공격 방지
- 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송

9. HTTP 헤더2 - 캐시와 조건부 요청

캐시 기본 동작

캐시가 없으면 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운로드 받아야 한다.

인터넷 네트워크는 상대적으로 매우 느리고 비싸다.
로딩 속도가 느림, 느린 사용자 경험

캐시 적용 시 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다.

비싼 네트워크 사용량을 줄일 수 있다.
상대적으로 로딩 속도가 매우 빠르다, 빠른 사용자 경험

검증 헤더와 조건부 요청1

캐시 유효 시간이 초과해서 서버에 다시 요청하면 다음 두 가지 상황이 나타난다.

서버에서 기존 데이터를 변경함 -> 새로 받아야 함
서버에서 기존 데이터를 변경하지 않음

데이터가 같다는 사실을 확인하면 캐시를 재사용 할 수 있다.
검증 헤더는 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터를 담는 헤더이다.
검증 헤더로 조건에 따른 분기
Last-Modified, ETag
If-Modified-Since: Last-Modified 사용
If-None-Match: ETag 사용
조건이 만족하면 200 OK
조건이 만족하지 않으면 304 Not Modified

검증헤더 Last-Modified

응답 메세지에 검증헤더 추가 Last-Modified: 2020년 11월 10일 10:00:00
해당 리소스의 요청헤더에 if-modified-since: 2020년 11월 10일 10:00:00 자동 추가 -> 응답에는 304 및 body 없음
- 캐시 유효 시간이 초과해도, 서버의 데이터가 갱신되지 않으면
- 304 Not Modified + 헤더 메타 정보만 응답(바디X)
- 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
- 클라이언트는 캐시에 저장되어 있는 데이터 재활용
- 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드
Nginx는 정적 파일 서빙 시 기본적으로 **파일 시스템의 mtime(수정 시간)**을 보고 Last-Modified 헤더를 자동으로 응답에 추가한다 함

검증 헤더와 조건부 요청2

Last-Modified, If-Modified-Since 단점

1초 미만(0.x초) 단위로 캐시 조정이 불가능
날짜 기반의 로직 사용
데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우
서버에서 별도의 캐시 로직을 관리하고 싶은 경우
예) 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우

ETag

ETag(Entity Tag)
캐시용 데이터에 임의의 고유한 버전 이름을 달아둠
- 예) ETag: "v1.0", ETag: "a2jiodwjekjl3"
데이터가 변경되면 이 이름을 바꾸어서 변경함(Hash를 다시 생성)
- 예) ETag: "aaaaa" -> ETag: "bbbbb"
진짜 단순하게 ETag만 보내서 같으면 유지, 다르면 다시 받기!
캐시 제어 로직을 서버에서 완전히 관리, 클라이언트는 단순히 이 값을 서버에 제공(클라이언트는 캐시 메커니즘을 모름)
- 서버는 배타 오픈 기간인 3일 동안 파일이 변경되어도 ETag를 동일하게 유지
- 애플리케이션 배포 주기에 맞추어 ETag 모두 갱신

캐시와 조건부 요청 헤더

캐시 제어 헤더

Cache-Control: 캐시 제어
- max-age: 캐시 유효 시간, 초 단위
- no-cache: 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용
- no-store: 데이터에 민감한 정보가 있으므로 저장하면 안됨
Pragma: 캐시 제어(하위 호환) - HTTP 1.0 하위 호환
Expires: 캐시 유효 기간(하위 호환) - 캐시 만료일 지정
- 지금은 더 유연한 Cache-Control: max-age 권장
- Cache-Control: max-age와 함께 사용하면 Expires는 무시

프록시 캐시

원서버 - 프록시 캐시 서버 - 클라이언트
속도 향상을 위해 컨텐츠를 사용자와 물리적으로 가까운 프록시 캐시 서버에서 반환하게 동작
Cache-Control:
- public: public 캐시에 저장되어도 됨
- private: 응답이 해당 사용자만을 위한 것임, private 캐시에 저장해야 함(기본값)
- s-maxage: 프록시 캐시에만 적용되는 max-age
- Age: 60 (HTTP 헤더): 오리진 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)

캐시 무효화

Cache-Control: no-cache, no-store, must-revalidate
- 내가 알기론 no-store만 써도 된다

1. 소개​

강의 목표​

2. 인터넷 네트워크​

인터넷 통신​

IP(인터넷 프로토콜)​

IP 프로토콜의 한계​

TCP, UDP​

인터넷 프로토콜 스택의 4계층​

MAC과 IP​

TCP 특징​

UDP​

PORT​

DNS​

3. URI와 웹 브라우저 요청 흐름​

URI​

URL​

웹 브라우저 요청 흐름​

4. HTTP 기본​

모든 것이 HTTP​

특징​

클라이언트 서버 구조​

Stateful, Stateless​

실무 한계​

비 연결성(connectionless)​

한계와 극복​

HTTP 메시지​

상세​

5. HTTP 메서드​

HTTP API를 만들어보자​

API URI 고민​

HTTP 메서드 종류​

HTTP 메서드 - GET, POST​

GET​

POST​

HTTP 메서드 - PUT, PATCH, DELETE​

PUT​

HTTP 메서드의 속성​

6. HTTP 메서드 활용​

클라이언트에서 서버로 데이터 전송​

클라이언트에서 서버로 데이터 전송​

HTML Form 데이터 전송​

HTTP API 데이터 전송​

HTTP API 설계 예시​

회원 관리 시스템​

참고하면 좋은 URI 설계 개념​

7. HTTP 상태코드​

HTTP 상태코드 소개​

2xx - 성공​

3xx - 리다이렉션​

영구 리다이렉션 301, 308​

일시적인 리다이렉션 302, 307, 303​

4xx - 클라이언트 오류, 5xx - 서버 오류​

4xx​

400 Bad Request​

401 Unauthorized​

403 Forbidden​

404 Not Found​

5xx (Server Error)​

500 Internal Server Error​

503 Service Unavailable​

8. HTTP 헤더1 - 일반 헤더​

HTTP 헤더 개요​

헤더 분류​

표현​

콘텐츠 협상​

협상 우선순위​

전송 방식​

일반 정보​

특별한 정보​

인증​

쿠키​

쿠키 - 도메인​

쿠키 - 경로​

쿠키 - 보안​

9. HTTP 헤더2 - 캐시와 조건부 요청​

캐시 기본 동작​

검증 헤더와 조건부 요청1​

검증헤더 Last-Modified​

검증 헤더와 조건부 요청2​

Last-Modified, If-Modified-Since 단점​

1. 소개

강의 목표

2. 인터넷 네트워크

인터넷 통신

IP(인터넷 프로토콜)

IP 프로토콜의 한계

TCP, UDP

인터넷 프로토콜 스택의 4계층

MAC과 IP

TCP 특징

UDP

PORT

DNS

3. URI와 웹 브라우저 요청 흐름

URI

URL

웹 브라우저 요청 흐름

4. HTTP 기본

모든 것이 HTTP

특징

클라이언트 서버 구조

Stateful, Stateless

실무 한계

비 연결성(connectionless)

한계와 극복

HTTP 메시지

상세

5. HTTP 메서드

HTTP API를 만들어보자

API URI 고민

HTTP 메서드 종류

HTTP 메서드 - GET, POST

GET

POST

HTTP 메서드 - PUT, PATCH, DELETE

PUT

HTTP 메서드의 속성

6. HTTP 메서드 활용

클라이언트에서 서버로 데이터 전송

클라이언트에서 서버로 데이터 전송

HTML Form 데이터 전송

HTTP API 데이터 전송

HTTP API 설계 예시

회원 관리 시스템

참고하면 좋은 URI 설계 개념

7. HTTP 상태코드

HTTP 상태코드 소개

2xx - 성공

3xx - 리다이렉션

영구 리다이렉션 301, 308

일시적인 리다이렉션 302, 307, 303

4xx - 클라이언트 오류, 5xx - 서버 오류

4xx

400 Bad Request

401 Unauthorized

403 Forbidden

404 Not Found

5xx (Server Error)

500 Internal Server Error

503 Service Unavailable

8. HTTP 헤더1 - 일반 헤더

HTTP 헤더 개요

헤더 분류

표현

콘텐츠 협상

협상 우선순위

전송 방식

일반 정보

특별한 정보

인증

쿠키

쿠키 - 도메인

쿠키 - 경로

쿠키 - 보안

9. HTTP 헤더2 - 캐시와 조건부 요청

캐시 기본 동작

검증 헤더와 조건부 요청1

검증헤더 Last-Modified

검증 헤더와 조건부 요청2

Last-Modified, If-Modified-Since 단점