도서명 : 데이터 분석이 쉬워지는 정규표현식: 인공지능 빅데이터 시대를 이끄는 정규표현식
저자 : 강명훈
발행일 : 2017년 4월 11일
ISBN : 9788994405292
정가 : 33,000 원
구매하기 : 강컴닷컴 | 인터파크 | YES24


 



책 소개

이 책은 프로그래머가 아닌 시스템 엔지니어 입장에서, 그리고 컴퓨터 환경에서 다양하게 발생하는 로그 데이터 분석 관점에서 저자가 경험한 정규표현식 이야기이다. 저자는 십여 년간 정규표현식을 사용하면서 겪었던 시행착오를 바탕으로 정규표현식을 좀 더 쉽게 익히고 싶어 하는 이들을 위해 이 책을 썼으며, 정규표현식을 이용해서 다양한 로그 데이터를 효과적으로 분석할 수 있음을 보여준다. 이 책을 통해 프로그래밍을 몰라도, 빅데이터를 몰라도 정규표현식만으로 데이터 분석가가 될 수 있다.

정규표현식은 다양한 프로그래밍 언어(C, Perl, Python, Ruby, Java )는 물론 데이터를 다루는 대부분의 컴퓨터 환경(R, SAS, MySQL )에서 지원하는 강력한 텍스트 데이터 처리 도구입니다. 아직 정규표현식을 접해보지 않았다면 이 책에서 그 유용함을 발견하게 될 것이며, 이미 사용하고 있다면 프로그래머에게만 필요한 도구라는 오해에서 벗어나, 새로운 활용 범위에 놀라게 될 것이다.

이 책은 기능이나 원리의 나열에 그치지 않고 로그 분석에 효과적인 사례 소개에 중점을 두고 있으며, 실무에 즉시 활용 가능한 다양한 예제를 제공합니다. 특히 로그 분석을 데이터 분석 수준으로 끌어올려 주는 정규표현식의 구조 및 동작 원리에 대한 시각적 해설을 제공함으로써 쉬운 이해가 가능하다는 강점을 가지고 있다.

 

도서 특징
 

1부는 정규표현식의 개념 및 역사와 함께 정규표현식 학습 도구 및 배경 기술 소개를 통해 독자의 학습 환경 적응을 돕고, 정규표현식의 자음과 모음인 메타 문자를 자연스럽게 익히도록 해주며, 단계별 응용을 통해 기능과 역할을 이해하는 데 집중한다.

2부는 정규표현식의 핵심적인 내부 동작 원리를 이해함으로써 실수를 줄이고, 효율적인 정규표현식 작성 및 테스트 방법을 제공하며, 다양한 데이터 분석 사례를 통해 지저분한 데이터를 정리하고 정제했을 때 어떤 가치를 얻을 수 있는지 보여준다.

쌓여만 가는 로그에 답답함을 느끼는 이들에게, 넘쳐나는 데이터에 대한 궁금증을 조금이라도 쉽게 해결하고 싶어 하는 이들에게 이 책을 권한다.

 

저자 소개
 

강명훈

정보보안 전문가가 아닌 로그 분석가. 해킹 하나 할 줄 모르면서 아직 정보보안 분야에 종사 중인 본인을 스스로도 신기해하며, 사고 분석이 아닌 데이터 분석 관점의 보안 솔루션 활용 방안에 관심이 많다. 로그 및 트래픽 데이터 분석을 주제로 개인 블로그(kangmyounghun.blogspot.com)를 운영 중이며, 본서 외 저서로는 '빅데이터 분석으로 살펴본 IDS와 보안관제의 완성(와우북스, 2013)'이 있다.

 
차례
 

1: 정규표현식 기초

1. 소개

  1. 정규표현식이란?
  2. 정규표현식 엔진
  3. 선수 지식
  4. 요약

 

2. 메타 문자

  1. 수정자
  2. 검사 범위가 지정된 메타 문자
  3. 수량자
  4. 검사 범위를 지정할 수 있는 메타 문자
  5. 검사 위치 지정 메타 문자
  6. 요약

 

3. 응용 기초

  1. 검사 방식
  2. 단어 검사
  3. 숫자 검사
  4. 이메일 주소 및 URL 검사
  5. IP 주소 검사
  6. 앵커 문자와 길이 검사
  7. 요약

 

- 2: 정규표현식 심화

4. 알고 보면 쉬운 개념들

  1. 백트래킹
  2. 백트래킹 제거
  3. /후방탐색과 수량자
  4. 기타
  5. 요약

 

5. 성능

  1. 수량자
  2. 캡쳐 그룹
  3. 앵커 문자
  4. OR 연산
  5. /후방탐색
  6. 요약

 

6. 응용 심화

  1. 로그와 친해지기
  2. Secure 로그 분석
  3. 웹 요청 트래픽 분석
  4. 웹 요청 트래픽 분석 심화
  5. 요약