MARC 닫기
00757nam 2200265 c 4500
000000757212
C_1140.cpp#604
090401s2008 ulkad 000 kor
▼a 9788963050041
▼g 13000:
▼c \18000
▼a 248023
▼c 248023
▼a kor
▼h jpn
▼l EM0000199137
▼a 005.74
▼2
▼a 005.74
▼b 서74ㄱ
▼a 서전규개
▼a 구글을 지탱하는 기술/
▼d 니시다 케이스케 저;
▼e 김성훈 역.
▼a Gooleえる技術
▼a 서울:
▼b 멘토르,
▼c 2008.
▼a 373 p.:
▼b 삽화, 도표;
▼c 23 cm.
▼a 검색 엔진 마스터=
▼x Search engine master;
▼v 2.
▼a 니시다 케이스케의 한자명은 '西田圭介' 임
▼a 구글
▼a 지탱
▼a 검색엔진
▼a 김성훈
▼a 니시다 케이스케
▼b \18000
▼a 단행본
▼a 005.74
▼b 서74ㄱ
KMO200901447
권 호 :
발행년 : 2008
발행처 : 멘토르
서 명 : 구글을 지탱하는 기술
목차
서문 = 7
감수자 서문 = 10
이 책에 대해서 = 16
1장 구글의 탄생
1. 검색엔진의 진화 = 30
이용자의 편의성을 가장 먼저 생각한다 = 30
하드웨어를 확장한다 = 32
웹 페이지에 순위를 매기다 = 33
Column : 페이지랭크의 현재 = 37
2. 검색엔진의 구조 = 38
검색엔진의 3요소 = 38
검색 서버의 역할 = 40
검색 백엔드의 역할 = 41
인덱스의 역할 = 42
검색에 적합한 인덱스 구조 = 44
데이터 구조를 색인한다 = 47
3. 크롤링-온 세상의 웹 페이지를 수집한다 = 50
기능적인 시스템 오류 = 50
Column : "마음에 드셨나요?" = 51
웹 페이지 수집에는 시간이 걸린다 = 52
여러 개의 다운로드를 동시에 진행한다 = 53
끝나지 않는 크롤링 = 54
4. 인덱스 생성-검색용 데이터베이스를 만든다 = 56
웹페이지의 구조 해석 = 56
단어 정보의 인덱스 = 58
링크 정보의 인덱스 = 62
랭킹 정보의 인덱스 = 64
검색 순위 = 65
5. 검색 서버-요청하는 정보를 즉석에서 찾아낸다 = 67
검색 결과에 순위를 매기다 = 67
복잡한 검색도 빠르게 실행한다 = 69
3단계 랭킹 시스템 = 70
구글의 기술력 파헤치기! : 초기 구글의 전체적인 모습 = 72
2장 구글의 공룡화
1. 인터넷을 검색하는 거대 시스템 = 78
값싼 PC를 대량으로 이용한다 = 78
하나의 시스템으로 연결한다 = 80
숫자만 늘린다고 능사는 아니다 = 82
CPU와 HDD를 알뜰하게 활용한다 = 84
검색엔진을 개량하자 = 86
2. 세계로 눈을 돌린 검색 클러스터 = 91
전 세계로 제공되는 웹 검색 서비스 = 91
가까운 데이터 센터로 접속한다 = 92
다수의 서버로 부하를 분산한다 = 93
일정한 페이지별로 인덱스를 분할한다 = 95
많은 인덱스를 한번에 검색한다 = 97
새로운 웹 검색 절차 = 99
구글의 기술력 파헤치기! : 구글의 기본적인 사상 = 102
3장 구글의 분산 스토리지
1.GFS-분산 파일 시스템 = 108
거대한 디스크 공간 = 108
방대한 데이터 통로 = 109
데이터 전송을 위한 특화 설계 = 111
파일 조작을 위한 인터페이스 = 113
파일은 자동적으로 복제된다 = 115
읽기-가장 가까운 서버를 이용한다 = 117
쓰기-복수의 서버를 이용한다 = 118
Column : 가장 가까운 서버 = 121
동시 기록의 문제점 = 122
원자적 쓰기 = 123
'Copy on write' 기능으로 스냅샷을 고속화한다 = 126
부하가 편중되지 않도록 균형을 유지한다 = 127
모든 장애 대책을 실행한다 = 128
읽기·쓰기를 모두 확장한다 = 132
복구 시간 = 135
데이터 관리의 기반으로서 동작한다 = 136
2. Bigtable-분산 스토리지 시스템 = 137
거대한 데이터베이스를 구축한다 = 137
구조화된 데이터를 저장한다 = 138
읽고 쓰기는 원자적으로 실행된다 = 144
테이블을 분할해서 관리한다 = 148
다수의 서버로 테이블을 분산처리한다 = 151
GFS와 메모리를 사용한 데이터 관리 = 153
테이블의 크기에 따른 부하 분산 = 159
다양한 방법으로 성능을 향상시킨다 = 163
사용 방법에 따라 성능이 바뀐다 = 166
3. Chubby-분산 잠금 서비스 = 171
분산 스토리지는 Chubby에서 시작된다 = 171
5개의 복사본이 만들어진다 = 172
파일 시스템으로 이용한다 = 174
잠금 서비스의 이용 = 178
통지를 활용한다 = 183
Column : DNS를 치환한다 = 185
마스터는 투표로 정해진다 = 186
구글의 기술력 파헤치기! : 구글의 기반 시스템 = 194
4장 구글의 분산 데이터 처리
1. MapReduce-분산처리를 위한 기반 기술 = 200
대용량 데이터 분산 가공 = 200
데이터 처리 기술 = 201
Column : MapReduce의 유래 = 204
역 인덱스를 만들어 보자 = 204
MapReduce로 할 수 있는 일 = 209
워커에 의한 공동작업-MapReduce의 전체 모습 = 212
3단계 처리 = 215
고속화에 필요한 아이디어 = 220
실행 과정에는 단계가 있다-MapReduce의 과정 = 223
MapReduce의 장애 대책 = 226
MapReduce의 읽기 성능 = 228
Column : Bigtable과 MapReduce = 232
2. Sawzall-분산처리용 프로그래밍 언어 = 234
간편한 분산처리를 꿈꾸는 사람들 = 234
스크립트 언어 프로그램 = 235
부작용을 초래하지 않는 언어 사양 = 239
표준 어그리게이터 = 244
보다 실제적인 프로그램의 예 = 247
에러는 무시할 수도 있다 = 253
Sawzall은 어떻게 구현될까? = 254
순조롭게 확장되는 실행 성능 = 255
Column : Bigtable과 Sawzall, 대규모 분산 시스템을 시험해 본다 = 257
구글의 기술력 파헤치기! : MapReduce와 Sawzall = 260
5장 구글의 운용 비용
1. 구글의 운용 비용은 얼마나 될까 = 264
하드웨어 구입 비용 = 264
저가의 하드웨어로 비용을 절감한다 = 267
전기료는 하드웨어만큼 비싸지 않다 = 269
간접적으로 추가되는 전력의 설비 비용 = 271
점점 늘어나는 전력 비용 = 272
2. CPU는 어디에 전기를 사용하는가 = 275
전력과 성능의 관계 = 275
CMOS 회로의 소비 전력 = 276
소비 전력을 억제하기 위한 방법 = 278
클럭 단위의 처리 효율성을 올린다 = 280
멀티 코어에 의한 성능 향상 = 286
3. PC의 소비 전력을 절감한다 = 288
고클럭 CPU는 전력 효율이 나쁘다 = 288
멀티 스레드를 활용하여 전력 효율을 높인다 = 291
전원의 효율을 높인다 = 292
4. 데이터 센터의 전력 배치 = 296
피크 전력은 비용과 직결된다 = 296
한정된 전력을 최대한 유용하게 사용한다 = 298
계층적 전력 배분의 설계 = 299
머신이 증가하면 전력은 평준화된다 = 302
전력 절감 기술로 비용 효율을 높인다 = 308
Column : 소비 전력의 측정 방법 = 310
방식을 바꾸면 설비 효율이 2배가 된다 = 311
5. 하드디스크는 언제 고장 나는가 = 312
10만 대의 하드디스크를 조사하다 = 312
고장의 전조가 되는 요인들 = 313
사용 시간과 고장률의 관계 = 314
사용 횟수와 고장률의 관계 = 316
온도와 고장률의 관계 = 317
고장률에 큰 영향을 미치는 몇 가지 SMART 값 = 319
SMART 값만으로 고장을 예측할 수 없다 = 325
Column : 통계 데이터의 처리 방법 = 327
하드디스크를 제대로 바라보자 = 328
6. 미국 전역으로 넓어지는 거대한 데이터 센터 = 329
오리건 주 댈러스 = 329
노스캐롤라이나 주 레노어 = 331
사우스캐롤라이나 주 버클리 카운티 = 332
오클라호마 주 프라이어 = 333
아이오와 주 카운실 블럽스 = 333
차세대 구글의 확장 = 334
데이터센터로 처리를 집약한다-Bigdaddy = 335
Column : 클린 에너지를 위한 구글의 노력 = 339
구글의 기술력 파헤치기! : 비용 우위성 = 340
6장 구글의 개발 체제
1. 자주성을 중시하는 소프트웨어 개발 = 346
선택된 프로젝트만이 살아남는다 = 346
소규모로 구성되는 프로젝트 팀 = 347
코드 리뷰에 의한 품질 향상 = 348
초기 단계부터 성능을 고려해야 한다 = 349
새로운 웹 서비스를 시작하기까지 = 350
정보는 철저하게 공유한다 = 353
Column : 다양한 TechTalk = 357
2. 커스터마이즈 = 358
오퍼레이팅 시스템 = 358
프로그래밍 언어 = 359
데이터베이스 = 359
SCM 소스 코드 관리 = 360
리뷰 시스템 = 362
3. 테스트를 자동화한다 = 363
테스트 엔지니어 팀 = 363
자동 테스트를 설계한다 = 364
기반 시스템을 테스트한다 = 366
Column : Testing on the Toilet = 367
구글의 기술력 파헤치기! : 구글의 환경과 체제 = 369
참고 문헌 = 371
바이브 코딩 혁명이 온다 : AI 에이전트와 제로 코드 소사이어티의 탄생
005.133 김73ㅂ
(바닥부터 배우는) 강화 학습 : 강화 학습 기초에 대한 쉽고 정확한 개념 설명
006.31 노57ㄱ
(맥스 테그마크의) 라이프 3.0 : 인공지능이 열어갈 인류와 생명의 미래
006.301 T261ㄹ백
인문의 재발견
001.3 안73ㅇ
서평쓰기