Análise de conjunto de dados sobre doença cardiovascular

Feito para apresentação no LaCCAN por Yago Andrade.

Atividade realizada

A atividade visa o tratamento da base de dados de pacientes anônimos com ou sem doenças cardiovasculares e a visualização dos dados coletados através da estatística. Há uma leve aplicação de modelos open-source de aprendizagem de máquina, visando a predição do diagnóstico com base nos dados coletados. Feito no Google Colab.

Base de dados

A base de dados sobre doença cardiovascular utilizada é um conjunto de dados do Kaggle, e consiste em dados de 68,030 pacientes (34,362 apresentando alguma doença cardiovascular e 33,668 não apresentando quaisquer tipo de doença cardiovascular) e contem 11 categorias de análise:

Idade (Age)
Altura (Height)
Peso (Weight)
Gênero (Gender)
Pressão arterial sistólica (Systolic blood pressure)
Pressão arterial diastólica (Diastolic blood pressure)
Colesterol (Cholesterol)
Glicose (Glucose)
Fumante (Smoker)
Ingestão de álcool (Alcohol intake)
Atividade física (Physical activity)

Algumas das características são descritas em forma numérica, outras são assignadas códigos de categoria e outros são valores binários. As classes tendem a ser balanceadas, entretanto, foram observadas mais pacientes do gênero feminino do que do gênero masculino.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
README.md		README.md
cardio.ipynb		cardio.ipynb
cardiodata.csv		cardiodata.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Análise de conjunto de dados sobre doença cardiovascular

Atividade realizada

Base de dados

About

Releases

Packages

Languages

yagoandrade/Cardiovascular-Research-ML

Folders and files

Latest commit

History

Repository files navigation

Análise de conjunto de dados sobre doença cardiovascular

Atividade realizada

Base de dados

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages