CSV란 무엇인가요?

CSV 구조와 장점, 그리고 인코딩·구분자 이슈를 포함한 실무 주의점을 정리합니다.

원본 문서 제목: CSV 是什么

섹션 1

CSV는 Comma-Separated Values의 약자입니다. 매우 단순한 표 형식 데이터 저장 방식으로, 한 줄은 한 개의 레코드, 한 열은 한 개의 필드를 뜻하고, 값들은 보통 쉼표로 구분됩니다. 구조가 단순하기 때문에 CSV는 데이터 교환에서 가장 흔한 형식 중 하나가 되었습니다. Excel에서 데이터를 내보내거나, 업무 시스템에서 보고서를 다운로드하거나, 사용자 목록을 다른 시스템으로 옮기거나, 주문 데이터를 일괄 처리할 때 CSV를 자주 만나게 됩니다.

섹션 2

CSV의 큰 장점은 가볍고 범용적이라는 점입니다. Excel 전용 형식과 달리 CSV는 거의 모든 프로그래밍 언어, 데이터베이스, 스크립트 도구, 스프레드시트 프로그램, 데이터 플랫폼에서 쉽게 읽을 수 있습니다. Python, Java, PHP, Node.js, 보고서 시스템, 가져오기 기능, 분석 도구 대부분이 CSV를 기본 지원합니다. 이는 CSV가 수식, 차트, 다중 시트, 복잡한 서식보다 순수한 구조화 데이터 자체에 집중하기 때문입니다. 그래서 시스템과 시스템 사이를 연결하는 중간 형식으로 매우 적합합니다.

섹션 3

하지만 CSV의 단순함은 동시에 한계이기도 합니다. 글꼴, 색상, 셀 병합, 수식 서식 같은 표현 정보는 보통 유지되지 않습니다. Excel에서 보기 좋게 꾸민 표를 CSV로 내보내면 대부분의 서식이 사라집니다. 또한 CSV는 인코딩, 구분자, 줄바꿈, 따옴표 처리 방식이 환경마다 다를 수 있습니다. 그래서 데이터는 있는데도 열이 어긋나 보이거나 글자가 깨져 보여서 파일이 망가졌다고 오해하는 일이 자주 생깁니다. 실제 문제는 데이터 손실이 아니라 잘못된 인코딩이나 구분자 규칙, 파싱 방식인 경우가 많습니다.

섹션 4

도구 사이트에서 CSV 관련 기능이 중요한 이유도 여기에 있습니다. 사용자는 단순히 CSV를 여는 것보다 인코딩 복구, 필드 정리, 중복 제거, 열 분리, CSV→JSON 변환, CSV→Excel 변환 같은 작업을 더 자주 필요로 합니다. 그래서 CSV를 설명할 때는 “쉼표로 구분된 텍스트 파일”이라고만 말하기보다, CSV가 구조화 데이터를 이동시키는 가벼운 용기라는 점을 알려 주는 편이 훨씬 도움이 됩니다. 그 관점을 이해하면 변환 후 서식이 사라지는 이유와 CSV 처리 도구가 왜 많은지도 자연스럽게 이해할 수 있습니다.