Big Recurrent Universal Network 0
Questo progetto punta a completare una competition di Kaggle Feedback Prize - Predicting Effective Arguments 📓, che consiste nel creare una rete neurale in grado di esprimere valutazioni riguardo alla correttezza di testi argomentativi scritti da studenti che vanno dalle maedie fino agli ultimi anni delle superiori.
Il dataset fornito da Kaggle presenta circa 3000 testi argomentativi di studenti statunitensi che variano in livello da medie a superiori. Ogni testo è stato analizzato da esperti per estrapolarne elementi del discorso comunemente trovati in testi argomentativi, in particolare:
Lead
: ovvero un'introduzione che serve per catturare l'attenzione del lettore e indirizzarlo verso la tesiPosition
: un'opinione o conclusioni tratte sull'argomento portatoClaim
: un'affermazione che supporti la posizioneCounterclaim
: un'affermazione che confuta un'altra affermazione o fornisce una motivazione contraria alla posizioneRebuttal
: una nuova affermazione che confuta laCounterclaim
Evidence
: idee a supporto dellaClaim
Concluding Statement
: una frase conclusiva che ribadisce le affermazioni
Ognuna di queste componenti è affiancata ad uno di tre giudizi che saranno le nostre label per la fase di training:
Ineffective
Adequate
Effective
- Python 3.8
- Jupyter Notebooks
- Transformers
- BERT
- Tenorflow
- Keras
- Pandas
- Matplotlib
- Docker
Altissima conoscienza di Machine Leanring & Deep Leanring 😲
- Interiorizzato funzionamento dei Transformers
- Analizzato nei minimi dettagli il dataset fornito (non ha più segreti per noi 🚀)
- GRAFICI 📈
- Procedura di PreProcessing del dataset OTTIMIZZATA e VELOCE
- Suddivisione Train - Validation intelligente 🤖
- GIGANTESCA lista di modelli diversi tra cui scegliere 💯
- Affrontato problema NON ALLENAMENTO (ANNICHILITO) 🤯
- ANCORA ALLENAMENTO ANCORA PIÙ INTENSIVO 🤖🔥🤯🤯
- DI NUOVO GRAFICI 📈📈
- Risultati ultra-performanti 🎱
Siamo riusciti ad ottenere il MIGLIORE modello di NLP mai visto nella storia 😲🤯!!!