MARC 닫기
00608nam ac200241 k 4500
000000733309
20220619191345
ta
031220s2003 ulka 001 kor
▼a 8973384155
▼g 93310:
▼c \13000
▼a 248023
▼c 248023
▼d 111314
▼l EM168087
▼a 001.422
▼a 519.5
▼a 001.422
▼b 안54ㄷ
▼a 안성진
▼a 데이터 탐색법/
▼d 안성진 지음.
▼a 서울:
▼b 自由아카데미,
▼c 2003.
▼a 310p.:
▼b 삽도;
▼c 26cm.
▼a 참고문헌: p.291-293, 색인수록
▼a 데이터
▼a 탐색법
▼b \13000
▼a FUTURE
▼a 단행본
KMO200303870
001.422-안54ㄷ
권 호 : 310p.
발행년 : 2003
발행처 : 自由아카데미
서 명 : 데이터 탐색법
목차
1. 과학, 데이터 분석, 탐색적 데이터 분석 = 1
1.1. 과학 = 1
1.2. 연구 설계 = 2
1.2.1. 변수와 데이터 = 2
1.2.2. 변수의 측정수준 = 4
1.2.3. 측정의 질 = 5
1.2.4. 데이터 획득과 연구 형태 = 6
1.3. 데이터 해석 = 7
1.4. 데이터 분석 = 8
1.5. 탐색적 데이터 분석과 확증적 데이터 분석 = 8
1.6. 탐색적 전망 : 두 원리와 네 주제 = 9
1.7. 데이터 그래픽스 = 16
1.7.1. 왜 그래프를 쓰는가? = 16
1.7.2. 그래픽 방법들의 목적 = 17
1.7.3. 데이터 분석에 대한 그래픽 방법들의 이점들 = 18
1.7.4. 그래픽 지각 = 23
1부 일변량 데이터 탐색 = 27
2. 밀도 추정 = 29
2.1. 히스토그램 : 데이터 요약 = 29
2.2. 평활 히스토그램 : 데이터 요약 = 34
2.3. 일변량 산점도 : 데이터 전시 = 42
2.4. 줄기그림 : 데이터(근사적) 전시 = 43
2.5. 연습문제 = 46
2.6. 보충 : 그림들을 위한 Minitab/SAS 프로그램들 = 47
3. 데이터 요약 : 수치적 요약과 상자그림 = 53
3.1. 몇 숫자들을 통한 전체분포요약 = 53
3.1.1. 다섯숫자 요약과 상자그림 = 53
3.1.2. 문자값들과 문자-값 전시 = 55
3.1.3. 백분위수 = 56
3.2. 한 숫자를 통한 분포특성요약 = 57
3.2.1. 위치 = 57
3.2.2. 산포도 = 62
3.2.3. 왜도 = 64
3.2.4. 첨도 = 66
3.3. 시각적 요약 : 상자그림 = 67
3.4. 사례연구 : 측정오차이론과 네온사인 = 69
3.5. 연습문제 = 73
3.6. 보충 : 몇몇 대칭분포들의 밀도곡선 = 74
3.7. 보충 : 몇몇 대칭분포의 문자값, 왜도와 첨도, 그리고 상자그림 관련값 = 76
4. 재표현 = 79
4.1. 거듭곱 사다리 = 80
4.2. 분포의 대칭화를 위한 재표현 = 81
4.2.1. 시행착오적 방법 = 81
4.2.2. 계량적 방법 = 84
4.3. 산포의 균형화를 위한 변환 = 88
4.3.1. 시행착오적 방법 = 88
4.3.2. 계량적 방법 = 88
4.4. 그 밖의 변환 = 93
4.4.1. 비율 데이터 = 93
4.4.2. 절대값이 1이하로 제한되는 데이터 = 95
4.4.3. 로그변환 = 96
4.4.4. 분산안정화 변환 = 96
4.5. 연습문제 = 98
5. 분포평가 = 99
5.1. 부유 루토그램에 의한 분포평가 = 99
5.1.1. 연속 데이터에 대한 부유 루토그램 = 100
5.1.2. 계수 데이터에 대한 부유 루토그램 = 106
5.1.3. DRR들의 이론적 배경 = 114
5.2. 확률도 = 115
5.2.1. 경험적분포함수와 타점위치 = 115
5.2.2. 분위수도 = 119
5.2.3. Q-Q 확률도 = 121
5.2.4. P-P 확률도 = 123
5.2.5. Q-Q 확률도와 P-P 확률도의 비교 = 125
5.2.6. 밀도 확률도 = 126
5.3. 정규확률도 = 128
5.3.1. 정규분포의 모수가 주어져 있는 경우 = 128
5.3.2. 정규분포의 모수가 주어져 있지 않은 경우 = 128
5.3.3. 여러 표본 데이터에 대한 정규확률도 = 131
5.4. 기타 간이 Q-Q 확률도 = 134
5.4.1. 균일분포 = 134
5.4.2. 지수분포 = 134
5.4.3. 와이블 분포 = 135
5.5. 연습문제 = 137
2부 다변량 데이터 탐색 = 139
6. 시계열 탐색 = 141
6.1. 시계열 산점도와 정형 = 141
6.2. 선형 평활기 = 143
6.3. 비선형 평활기 = 147
6.4. 평활기의 결합 = 148
6.5. 연습문제 = 155
7. 이변량 양적 데이터 탐색 = 157
7.1. 이변량 산점도 = 158
7.1.1. 산점도 작성지침 = 158
7.1.2. 보강된 이변량 산점도 = 161
7.2. 재표현 = 165
7.2.1. 팽창규칙 = 165
7.2.2. 주변 산점도를 이용한 방법 = 167
7.3. 관계를 요약하기 : 직선적합 = 170
7.3.1. 최소제곱 적합 = 171
7.3.2. 짝짓기에 의한 직선 적합 = 173
7.3.3. 최소절대 적합 = 174
7.3.4. 눈어림에 의한 반복적 직선 적합 = 176
7.3.5. 세 집단 저항성 직선 = 178
7.3.6. 튜키 직선 = 180
7.3.7. 저항성 직선 = 180
7.4. 평활 = 181
7.4.1. 수직띠 기법 = 181
7.4.2. LOWESS에 의한 평활기법 = 182
7.5. 연습문제 = 189
8. 이원표 탐색 = 191
8.1. 이원 잔차 : 행+열의 분석 = 191
8.1.1. 가법 모형 = 191
8.1.2. 효과들을 분리하기 = 192
8.1.3. "행+열" 적합 = 193
8.1.4. 데이터 변환 = 193
8.2. 중위수 닦기 = 196
8.2.1. 네 단계 중위수 닦기 = 196
8.2.2. 효과들을 분리하기 = 197
8.3. 연습문제 = 207
9. 다변량 데이터 탐색 = 209
9.1. 시각적 탐색 = 210
9.1.1. 세 변수를 위한 그래픽스 = 211
9.1.2. 산점도들의 행렬 = 218
9.1.3. 측면도 = 220
9.1.4. 주성분 행·열도 = 221
9.2. 수치적 탐색 = 225
9.3. EDA, 데이터 마이닝 그리고 KDD = 228
9.4. 연습문제 = 230
10. 재표집법에 의한 직접적인 불확실성 평가 = 231
10.1. 교차타당화법 = 232
10.2. 랜덤화 검정 = 237
10.3. 붓스트랩법 = 240
10.4. 잭나이프법 = 243
참고문헌 = 246
찾아보기 = 249
EDA 용어들 = 259
바이브 코딩 혁명이 온다 : AI 에이전트와 제로 코드 소사이어티의 탄생
005.133 김73ㅂ
(맥스 테그마크의) 라이프 3.0 : 인공지능이 열어갈 인류와 생명의 미래
006.301 T261ㄹ백
(2025) SQLD 모든 것 : #SQLD 14일 합격
005.7585 아68s
인문의 재발견
001.3 안73ㅇ
서평쓰기