레드 와인 퀄리티 분석
프로젝트 발표
- 프로젝트 소개
- 데이터 설명
- 데이터 전처리 및 EDA
- 모델 적용, 학습
- 모델 평가
- 하이퍼파라미터 적용
데이터 설명
이 데이터셋은 포르투갈 "Vinho Verde" 와인의 레드 버전과 관련이 있으며, 이는 물리화학적(입력) 및 감각적(출력) 변수를 포함하고 있습니다. 이 데이터는 분류 또는 회귀 작업에 사용될 수 있으며, 주어진 기능을 기반으로 와인의 품질을 예측하는 것이 목표입니다. 품질은 0부터 10까지의 점수로 평가됩니다.
입력 변수에 대한 요약은 다음과 같습니다:
- 고정 산도:
- 와인과 관련된 산 또는 비휘발성 산을 나타냅니다.
- 휘발성 산도:
- 와인에 함유된 아세트산의 양을 나타내며 높은 수준은 불쾌한 식초 맛으로 이어질 수 있습니다.
- 구연산:
- 소량으로 발견되며 와인에 '신선함'과 풍미를 추가할 수 있습니다.
- 잔류 설탕:
- 발효가 멈춘 후 남아 있는 설탕의 양을 나타내며 45 그램/리터 이상의 와인은 달콤한 것으로 간주됩니다.
- 염화물:
- 자유 이산화황:
- 미생물의 성장과 와인의 산화를 방지하는 이산화황의 자유 형태입니다.
- 총 이산화황:
- 이산화황의 자유 및 결합 형태의 양을 나타냅니다. 농도가 50 ppm 이상인 경우 와인의 냄새와 맛에서 이산화황이 뚜렷해집니다.
- 밀도:
- 와인의 밀도로, 알코올 및 설탕 함량에 영향을 받습니다.