Benvenuto in Scribd!

Salta carosello

Pre LSTM Intent Classification

Caricato da

Dennis Min Zeng

Il 0% ha trovato utile questo documento (0 voti)

166 visualizzazioni11 pagine

Deep Learning Hot

Copyright

Formati disponibili

PDF, TXT o leggi online da Scribd

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Segnala questo documento

Deep Learning Hot

Copyright:

Formati disponibili

Scarica in formato PDF, TXT o leggi online su Scribd

Segnala contenuti inappropriati

Il 0% ha trovato utile questo documento (0 voti)

166 visualizzazioni11 pagine

Pre LSTM Intent Classification

Caricato da

Dennis Min Zeng

Deep Learning Hot

Copyright:

Formati disponibili

Scarica in formato PDF, TXT o leggi online su Scribd

Segnala contenuti inappropriati

Salta alla pagina

Sei sulla pagina 1di 11

Cerca all'interno del documento

LSTM & Intent

Classification
Shijie Sun
12-23-2016
Outline

Introduction to RNNs
Why LSTM?
Training an LSTM Model for Intent Classification
How to Improve?
Current Results
Challenges & Future work
Introduction to RNNs

NN (Neural Network): Origins: Algorithms that mimic the brain

(Source: Wikipedia)

Perceptron, Neuron, Activation Function

Loss Function, Feedforward, Backpropagation
ANN (Artificial), DNN (Deep), CNN (Convolutional), RNN (Recurrent)
Introduction to RNNs

RNNs (Recurrent Neural Networks)

Make use of sequential information

LSTM (Long Short Term Memory), GRU (Gated Recurrent Units)
Why LSTM?

Plain RNNs is hard to train! (Backpropagation Through Time, BPTT)

RNNs trained with BPTT have difficulties learning long-term dependencies
(vanishing/exploding gradient problem).
Now structure: LSTM (Long Short Term Memory), etc

(Source: Wikipedia) (Source: arXiv:1503.04069 [cs.NE])

Further Reference: http://colah.github.io/posts/2015-08-Understanding-LSTMs/

Training an LSTM Model for Intent
Classification

Tensorflow
Data Preprocessing
Tokenize Words
Word Embedding

Mini-batched Gradient Descent

Mini-batch
Feedforward
Loss Function: Cross Entropy
Backpropagation
How to Improve?

Split dataset to prevent overfitting (Trainset, Validset, Testset)

Generalize raw data based on pattern
Adjust learning rate dynamically
Stop Criteria
Tune the parameters (forget ratio, cell size, learning rate, etc.)
Fixed sequence length vs. dynamic sequence length
Weight loss function
Current Results

Overall Accuracy: 93.1%

Domain Precision Recall Domain Precision Recall

None 90.5% 92.1% Hotel 90.6% 56.9%

Taxi 92.8% 91.8% Flower 93.2% 93.5%
Weather 99.1% 99.6% Repair 91.7% 71.4%
Clean 90.4% 97.4% Paotui 85.3% 85.3%
Massage 74.4% 93.5% Coffee 93.1% 95.0%
Air 95.7% 95.3% Reminder 96.3% 96.3%
Train 95.7% 95.1% Complain 89.4% 76.3%

Challenges & Future Works

For training data

Few samples for some domains
Incorrect labels
Confusing judgements

For model
Lack of previous information
Key words oriented
Various interpretations
Similar expressions
Changing intent
Challenges & Future Works

For data labeling

Label all sequences or just some important sequences
Unify the judgement

For model improvement

Add more data manually to improve the performance on hard-
understanding patterns or rare situations
Involve context, i.e. involve the former sequences or their labels
Potentiality : 1/3 wrong prediction can be corrected
Challenges : qualified training data, usage of context
Thank you!
Reference
[1] colahs blog. http://colah.github.io/posts/2015-08-Understanding-LSTMs/
[2] Wildml series blog. http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-
introduction-to-rnns/

Potrebbero piacerti anche

Wharton Consulting Case Book
Documento68 pagine
Wharton Consulting Case Book
Aaron ひろき Zhang
100% (4)
Case Book Chicago
Documento24 pagine
Case Book Chicago
Bob Johnson
Nessuna valutazione finora
Fake News Detection Using Machine Learning
Documento11 pagine
Fake News Detection Using Machine Learning
IJARSCT Journal
100% (1)
Ross Guide
Documento107 pagine
Ross Guide
garimag2k
100% (1)
50 Deep Learning Technical Interview Questions With Answers
Documento20 pagine
50 Deep Learning Technical Interview Questions With Answers
Ikram Laaroussi
100% (1)
WCC Core Connector 2008-2009
Documento26 pagine
WCC Core Connector 2008-2009
Dennis Min Zeng
33% (3)
Artificial Neural Network
Documento37 pagine
Artificial Neural Network
ashiammu
Nessuna valutazione finora
Data Science Deep Learning & Artificial Intelligence
Documento9 pagine
Data Science Deep Learning & Artificial Intelligence
my training
Nessuna valutazione finora
Digital Modulations using Matlab
Da Everand
Digital Modulations using Matlab
Mathuranathan Viswanathan
Valutazione: 4 su 5 stelle
4/5 (6)
AI Guide Ebook PDF
Documento52 pagine
AI Guide Ebook PDF
bayo4toyin
50% (2)
AI TRANSFORMS HR WITH RECRUITMENT AND PERFORMANCE ANALYTICS
Documento2 pagine
AI TRANSFORMS HR WITH RECRUITMENT AND PERFORMANCE ANALYTICS
muskan kharbanda
Nessuna valutazione finora
Scala for Machine Learning
Da Everand
Scala for Machine Learning
Nicolas Patrick R.
Nessuna valutazione finora
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
Da Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: NAIVE BAYES, NEAREST NEIGHBORS and NEURAL NETWORKS: Examples with MATLAB
César Pérez López
Nessuna valutazione finora
Deep Learning Turorial PDF
Documento301 pagine
Deep Learning Turorial PDF
Dennis Min Zeng
Nessuna valutazione finora
Accenture Unlocking Innovation Investment Value
Documento41 pagine
Accenture Unlocking Innovation Investment Value
s.chabot4130
Nessuna valutazione finora
Cory Rieth Lecture MVPA
Documento23 pagine
Cory Rieth Lecture MVPA
Rasheed Kibria
Nessuna valutazione finora
7 - Conceptual Data Science
Documento22 pagine
7 - Conceptual Data Science
Putri Anisa
Nessuna valutazione finora
Day 6 of 100 Data Science Interview Questions Series!!
Documento3 pagine
Day 6 of 100 Data Science Interview Questions Series!!
Silga
Nessuna valutazione finora
Deep Learning For Time Series Forecasting
Documento5 pagine
Deep Learning For Time Series Forecasting
Agung Nugraha
Nessuna valutazione finora
Deep Learning Data Synthesis For 5 GChannel Estimation Example
Documento12 pagine
Deep Learning Data Synthesis For 5 GChannel Estimation Example
srinivascbit
Nessuna valutazione finora
STMs and LSTM Variations For Prediction
Documento16 pagine
STMs and LSTM Variations For Prediction
Nikhil Saini
Nessuna valutazione finora
Christopher Manning Lecture 5: Language Models and Recurrent Neural Networks (Oh, and Finish Neural Dependency Parsing J)
Documento66 pagine
Christopher Manning Lecture 5: Language Models and Recurrent Neural Networks (Oh, and Finish Neural Dependency Parsing J)
Muhammad Arshad Awan
Nessuna valutazione finora
MoveNet SinglePose Model Card
Documento5 pagine
MoveNet SinglePose Model Card
Aki Sora
Nessuna valutazione finora
SVM Methodology 20201026
Documento7 pagine
SVM Methodology 20201026
GABRIEL BAYUNANDA PINARINGAN
Nessuna valutazione finora
Sklearn Cross-Validation Techniques
Documento9 pagine
Sklearn Cross-Validation Techniques
Priya dharshini.G
Nessuna valutazione finora
Table of Content
Documento7 pagine
Table of Content
Amrutha reddy karumuru
Nessuna valutazione finora
Deep Learning RNN
Documento53 pagine
Deep Learning RNN
srpatil051
Nessuna valutazione finora
Automatic Early Stopping Using Cross Validation: Quantifying The Criteria
Documento7 pagine
Automatic Early Stopping Using Cross Validation: Quantifying The Criteria
Amine Khalfallah
Nessuna valutazione finora
Data Mining Project - 27.06.2021
Documento6 pagine
Data Mining Project - 27.06.2021
vansh gupta
Nessuna valutazione finora
PPT
Documento15 pagine
PPT
altaf
Nessuna valutazione finora
Lecture 10: Memory System - Memory Technology: CSE 564 Computer Architecture Summer 2017
Documento44 pagine
Lecture 10: Memory System - Memory Technology: CSE 564 Computer Architecture Summer 2017
Richu Gupta
Nessuna valutazione finora
Che 4C3/6C3: Lecturer: Dr. John Macgregor Ta'S: Arv Jegatheesan, Nrb-B105, Ext. 26876, Jegatha@Mcmaster - Ca
Documento14 pagine
Che 4C3/6C3: Lecturer: Dr. John Macgregor Ta'S: Arv Jegatheesan, Nrb-B105, Ext. 26876, Jegatha@Mcmaster - Ca
tamer_aci
Nessuna valutazione finora
Introductory Lecture 2007 PDF
Documento14 pagine
Introductory Lecture 2007 PDF
tamer_aci
Nessuna valutazione finora
Disease Detection
Documento17 pagine
Disease Detection
Bharat Dedhia
Nessuna valutazione finora
ICASSP.2019.8682654
Documento5 pagine
ICASSP.2019.8682654
Adit Kholiq
Nessuna valutazione finora
Data Analysis of Political Speeches
Documento18 pagine
Data Analysis of Political Speeches
PalashKulshrestha
Nessuna valutazione finora
TP3_MI204_SANTOS_SCARDELLATO (1)
Documento20 pagine
TP3_MI204_SANTOS_SCARDELLATO (1)
Doente Pedro
Nessuna valutazione finora
Data Mining - Weka 3.6.0
Documento5 pagine
Data Mining - Weka 3.6.0
Navee Jayakody
Nessuna valutazione finora
ProjectReport Kanwarpal
Documento17 pagine
ProjectReport Kanwarpal
Kanwarpal Singh
Nessuna valutazione finora
Channel Equalization Using Ga Family: Archived in
Documento154 pagine
Channel Equalization Using Ga Family: Archived in
NishantKumar
Nessuna valutazione finora
Google Project Soli: Presenter: Wenguang Mao
Documento28 pagine
Google Project Soli: Presenter: Wenguang Mao
tohil chini
Nessuna valutazione finora
Neural Networks Paper
Documento8 pagine
Neural Networks Paper
Guvvala Venkataramireddy
Nessuna valutazione finora
Practical Guide To Keras
Documento28 pagine
Practical Guide To Keras
francois
Nessuna valutazione finora
Remaining Life Estimation With Keras - by Marco Cerliani - Towards Data Science
Documento7 pagine
Remaining Life Estimation With Keras - by Marco Cerliani - Towards Data Science
8c354be21d
Nessuna valutazione finora
Data Mining Assignment Help
Documento5 pagine
Data Mining Assignment Help
Statistics Homework Solver
Nessuna valutazione finora
Represented Using Tensors, and As A Result, Neural Network Programming Utilizes
Documento32 pagine
Represented Using Tensors, and As A Result, Neural Network Programming Utilizes
Yogesh Krishna
Nessuna valutazione finora
Improve The Accuracy of A CNN Layer in Deep Learning
Documento14 pagine
Improve The Accuracy of A CNN Layer in Deep Learning
Rahma Rhma
Nessuna valutazione finora
Data Science Assignment 2
Documento14 pagine
Data Science Assignment 2
anigunasekara
Nessuna valutazione finora
A Tutorial On Sequential Machine Learning
Documento10 pagine
A Tutorial On Sequential Machine Learning
ahmed awsi
Nessuna valutazione finora
Intro ML Applications
Documento26 pagine
Intro ML Applications
swetank.raut22
Nessuna valutazione finora
Lecture 3 - MachineLearning-CrashCourse2023
Documento99 pagine
Lecture 3 - MachineLearning-CrashCourse2023
Giorgio Aduso
Nessuna valutazione finora
What is Neural Network
Documento23 pagine
What is Neural Network
B Basit
Nessuna valutazione finora
A Probabilistic Theory of Deep Learning: Unit 2
Documento17 pagine
A Probabilistic Theory of Deep Learning: Unit 2
Harshit
Nessuna valutazione finora
4 - 1BackPropogation
Documento49 pagine
4 - 1BackPropogation
Vikash Kumar
Nessuna valutazione finora
RNN Training Steps Guide
Documento13 pagine
RNN Training Steps Guide
Tegu Limenih
Nessuna valutazione finora
RNN Neural Network
Documento23 pagine
RNN Neural Network
Nusrat Ullah
Nessuna valutazione finora
Early Stopping Neural Network Example
Documento14 pagine
Early Stopping Neural Network Example
Alina Burdyuh
Nessuna valutazione finora
Data Science Course Content
Documento8 pagine
Data Science Course Content
Qshore online training
Nessuna valutazione finora
Rev Insurance Business Report
Documento4 pagine
Rev Insurance Business Report
Pratigya pathak
Nessuna valutazione finora
Table of Content: (Page Numbers in PDF File)
Documento223 pagine
Table of Content: (Page Numbers in PDF File)
L V
Nessuna valutazione finora
Lecture 15 - Recap and Midterm Review
Documento37 pagine
Lecture 15 - Recap and Midterm Review
deponly
Nessuna valutazione finora
Bitcoin Modules
Documento7 pagine
Bitcoin Modules
Anonymous vEkqfN
Nessuna valutazione finora
Machine Learning Final Exam Review
Documento32 pagine
Machine Learning Final Exam Review
Yuan Zhuang
Nessuna valutazione finora
Region-Based Techniques For Modeling and Enhancing Cluster Openmp Performance
Documento22 pagine
Region-Based Techniques For Modeling and Enhancing Cluster Openmp Performance
dudeabc
Nessuna valutazione finora
Computer Vision HW 6 Report
Documento3 pagine
Computer Vision HW 6 Report
Ethan
Nessuna valutazione finora
Module 4 Recurrent Neural Network
Documento78 pagine
Module 4 Recurrent Neural Network
itsnavani2002
Nessuna valutazione finora
DL Class3
Documento28 pagine
DL Class3
Rishi Chaary
Nessuna valutazione finora
Unit 2
Documento13 pagine
Unit 2
read4free
Nessuna valutazione finora
5 1 ArtificialNeuralNetworks 4up
Documento12 pagine
5 1 ArtificialNeuralNetworks 4up
RidwanIlyasCahya
Nessuna valutazione finora
Textprocessingboth PDF
Documento46 pagine
Textprocessingboth PDF
Dennis Min Zeng
Nessuna valutazione finora
What Is Leadership PDF
Documento5 pagine
What Is Leadership PDF
Dennis Min Zeng
Nessuna valutazione finora
Introduction To NLP: What Is Natural Language Processing?
Documento14 pagine
Introduction To NLP: What Is Natural Language Processing?
Sandeep Vazrapu
Nessuna valutazione finora
Introduction To NLP: What Is Natural Language Processing?
Documento14 pagine
Introduction To NLP: What Is Natural Language Processing?
Sandeep Vazrapu
Nessuna valutazione finora
MGI Emerging Equity
Documento108 pagine
MGI Emerging Equity
Cheung Kin Yeung
Nessuna valutazione finora
2009-2010 Duke Fuqua MCC Case Book
Documento129 pagine
2009-2010 Duke Fuqua MCC Case Book
r_oko
100% (2)
China Internet 091205
Documento118 pagine
China Internet 091205
Dennis Min Zeng
Nessuna valutazione finora
Final Respondent University of Allahabad
Documento36 pagine
Final Respondent University of Allahabad
ritesh4kumar-29
Nessuna valutazione finora
Research Paper Aviation 7
Documento10 pagine
Research Paper Aviation 7
Aditya Yadav
Nessuna valutazione finora
RonanAlmeidaResume PDF
Documento1 pagina
RonanAlmeidaResume PDF
fat
Nessuna valutazione finora
03 - How To Combat The Dark Side of AI
Documento10 pagine
03 - How To Combat The Dark Side of AI
l.scheunert
Nessuna valutazione finora
AI-based Condition Monitoring For Low Voltage Motors
Documento23 pagine
AI-based Condition Monitoring For Low Voltage Motors
Bryan Ortega
Nessuna valutazione finora
Lesson Plan-Soft Computing - 8th Sem B. Tech - Dr. Debahuti Mishra - 0
Documento4 pagine
Lesson Plan-Soft Computing - 8th Sem B. Tech - Dr. Debahuti Mishra - 0
Lowry Guetta
Nessuna valutazione finora
Is205 Discussion 6
Documento2 pagine
Is205 Discussion 6
Jayson Tasarra
Nessuna valutazione finora
OmNarayanSingh CC306 IS Final
Documento15 pagine
OmNarayanSingh CC306 IS Final
Om Singh
Nessuna valutazione finora
Tổng hợp bài mẫu task 2 Kiên Luyện
Documento48 pagine
Tổng hợp bài mẫu task 2 Kiên Luyện
enfa.work.conf
Nessuna valutazione finora
People Analytics: Transforming HR Strategy With Data Science
Documento17 pagine
People Analytics: Transforming HR Strategy With Data Science
Alex Edward
Nessuna valutazione finora
15 27.10.2020 Machine Learning Johan Van Middelaar TNO
Documento13 pagine
15 27.10.2020 Machine Learning Johan Van Middelaar TNO
Shahzad
Nessuna valutazione finora
New Culture of Work White Paper
Documento15 pagine
New Culture of Work White Paper
kosaraju
Nessuna valutazione finora
AnI Parivartana
Documento120 pagine
AnI Parivartana
Gao Sati
Nessuna valutazione finora
Uncertainty and Imprecision in Decision Making and Decision Support: New Challenges, Solutions and Perspectives
Documento452 pagine
Uncertainty and Imprecision in Decision Making and Decision Support: New Challenges, Solutions and Perspectives
john.arvelo.pqv
Nessuna valutazione finora
Automated Wild-Animal Intrusion Detection and Repellent System Using Artificial Intelligence of Things
Documento6 pagine
Automated Wild-Animal Intrusion Detection and Repellent System Using Artificial Intelligence of Things
Siva Foreview
Nessuna valutazione finora
Einstein Briefing in A Box - Einstein GPT For Sales
Documento29 pagine
Einstein Briefing in A Box - Einstein GPT For Sales
Abdel Majid Ed-dahbi
Nessuna valutazione finora
(Clifford, Alan Hooker) Reason, Regulation and Realism PDF
Documento770 pagine
(Clifford, Alan Hooker) Reason, Regulation and Realism PDF
chrz90
Nessuna valutazione finora
Cancer Diagnosis Using Modified Fuzzy Network
Documento6 pagine
Cancer Diagnosis Using Modified Fuzzy Network
Universal Journal of Computer Science and Engineering Technology
Nessuna valutazione finora
A Hierarchical Fused Fuzzy Deep Neural Network For Data Classification
Documento8 pagine
A Hierarchical Fused Fuzzy Deep Neural Network For Data Classification
Yosua Siregar
Nessuna valutazione finora
GPI Artificial Intelligence Part III
Documento8 pagine
GPI Artificial Intelligence Part III
Arun AR
Nessuna valutazione finora
Gen AI
Documento15 pagine
Gen AI
rdiversi6666
Nessuna valutazione finora
Villarama Christian Michael AS1
Documento11 pagine
Villarama Christian Michael AS1
ThortheGreay
Nessuna valutazione finora
Fdy2eusin0rzf PDF
Documento20 pagine
Fdy2eusin0rzf PDF
Nguyen Thanh Tri
Nessuna valutazione finora
Automated crop mapping using machine learning
Documento15 pagine
Automated crop mapping using machine learning
Madhukalyan Chodisetty
Nessuna valutazione finora
GE ELECT 3 – Living in the IT Era | 1st Sem, AY 2022-2023
Documento80 pagine
GE ELECT 3 – Living in the IT Era | 1st Sem, AY 2022-2023
Angela Joy Amparado
Nessuna valutazione finora
Understanding Intelligence and AI
Documento173 pagine
Understanding Intelligence and AI
Bhavya Dedhia
Nessuna valutazione finora