동서대 소프트웨어중심대학사업단,동서대SW중심대학사업단

커뮤니티
동서대학교 소프트웨어중심대학사업단과 소통하는 공간입니다
home
커뮤니티
2021학년도1학기 게시판
목 록
[AI시스템설계(101)] 프로젝트에 사용될 데이터 공유
날짜:2021-06-02조회수:1949작성자:이종배

20181582 이종배


CIFAR-10

10개의 클래스를 가지는 32x32 크기의 컬러 이미지로 구성된 데이터 셋입니다.

각 클래스당 5000개의 훈련 세트, 1000개의 테스트 세트로 총 6만개의 이미지로 구성되어 있습니다.

http://www.cs.toronto.edu/~kriz/cifar.html

첨부파일 1
첨부파일 2
작성자 : 20161496_김도현
김도현 / ADHD와 정상인의 EEG데이터(https://ieee-dataport.org/open-access/eeg-data-adhd-control-children)
2021-06-02 13:19:32
삭제
작성자 : 20152535김동균
20152535 김동균 / 남자와 여자의 키로 성별 구분하기
https://www.kaggle.com/saranpannasuriyaporn/male-female-height-and-weight
2021-06-05 01:06:06
삭제
작성자 : 강연우
20161477
사이킷 럿에서 기본제공하는 데이터 셋인 와인 데이터 셋을 사용하려고 합니다.
와인의 화학 조성을 사용하여 와인의 종류를 예측하기 위한 데이터입니다.
2021-06-07 23:17:17
삭제
작성자 : 20152706 한민수
20152706 한민수 / 휴대폰별 스펙, 가격 데이터
train (21 x 2000), test (21 x 1000)의 데이터 구성
https://www.kaggle.com/iabhishekofficial/mobile-price-classification
2021-06-05 21:46:29
삭제
작성자 : 20152620 양가현
20152620 양가현 / 올리베티 얼굴 사진 데이터
AT&T와 캠프리지 대학 전산 연구실에서 공동으로 제작한 얼굴 사진 데이터 베이스의 간략화된 버전
64x64=4096 해상도의 흑백 이미지 사진이며 40명의 사진 400장으로 구성
2021-06-06 18:45:52
삭제
작성자 : 20171554 유성운
breast_cancer_dataset
https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
Classes:2, Samples per class: 212(M),357(B), Samples total: 569, Dimensionality: 30, Features: real, positive
유방암을 악성과 양성의 이진분류로 확인할 수 있는 데이터셋입니다.
2021-06-08 00:03:54
삭제
작성자 : 20181618
20181618/ 조선진 / 통신회사 사용자 데이터
사용자의 이탈을 예측하는 데이터 입니다
https://www.kaggle.com/radmirzosimov/telecom-users-dataset
2021-06-09 06:04:27
삭제
작성자 : 남상윤
20161535 / 남상윤 / 허리통증 증상 데이터
https://www.kaggle.com/sammy123/lower-back-pain-symptoms-dataset
2021-06-09 17:12:57
삭제
작성자 : 20152638 이도경
20152638/ 이도경 / 유방암 데이터셋
2021-06-09 20:20:27
삭제
작성자 : 20162626 김우성
20162626 / 김우성 / 캘리포니아 집값 데이터
경도, 위도, 주택 나이, 전체 방 수, 인구, 세대, 소득, 주택 가치, 전체 침실 수, 바다 근접도 등 10개의 특징을 가지는 20,640개의 데이터 셋 입니다.
https://www.kaggle.com/camnugent/california-housing-prices
2021-06-09 21:18:33
삭제
작성자 : 20161658
20161658 / 최지훈 / 타이타닉호 탑승 인원 정보
생존 여부, 티켓 등급, 나이, 성별 등을 통해 생존자를 예측하는 데이터 입니다. 훈련 세트 891개와 테스트 세트 418개를 가지고 있습니다.
https://www.kaggle.com/c/titanic/data

2021-06-09 22:20:00
삭제
작성자 : 김태우
20171318/김태우/과일과 채소 이미지 데이터 셋
131종의 과일과 채소로 100x100 크기의 이미지 90483개의 이미지 파일을 가지고 있습니다.
https://www.kaggle.com/moltean/fruits
2021-06-09 22:27:10
삭제
작성자 : 최재민
20171610/최재민/sklearn의 digists 데이터셋
digits 데이터는 sklearn에서 제공하는 기본 데이터셋으로
8x8픽셀로 이루어져 각 픽셀하나의 흑백의 강도를 0~16으로 표현하여
손글씨 이미지 데이터가 1797개가 모여있는 데이터셋입니다.
2021-06-09 23:14:30
삭제
작성자 : 20171569-이승용
sklearn에서 제공하는 위스콘신 유방암 데이터를 사용하겠습니다.
위스콘신 데이터는 종양의 크기, 모양 등의 다양한 속성값을 기반으로 해당 종양이 악성인지 양성인지를 분류한 데이터입니다.
569개의 샘플과 30개의 특성을 가집니다.
타겟값은 음성과 양성을 나타내는 0, 1 그리고 타겟값의 수는 212개의 정상종양(0)과 357개의 악성종양(1)개가 존재합니다.

전처리는 StandardScaler() 사용, 및 구현 과 최소-최대 정규화 함수로 전처리를 진행합니다.
이 데이터를 MLP, SVM, KNN 세가지 기법을 이용하여 정확률을 비교해보겠습니다.



2021-06-11 13:06:50
삭제
작성자 : 20162522 이창길
20162522/이창길
온라인 뉴스 인기데이터 셋
해당 뉴스의 sns공유횟수를 예측하는 데이터셋입니다.
https://archive.ics.uci.edu/ml/datasets/Online+News+Popularity#
2021-06-11 15:05:51
삭제
작성자 : 20152669 장재일
sklearn 에서 기본제공하는 irsi 붓꽃 데이터셋
붓꽃의 품종, 꽃잎, 꽃받침 폭과 길이를 담은 데이터셋입니다.
샘플의 개수는 품종마다 50개씩 총 150개입니다.

2021-06-11 22:04:23
삭제
목 록
삭 제
수 정