[RNN] Tìm hiểu về giải thuật BPTT và vấn đề mất mát đạo hàm

22 tháng 10, 2017 mục Học Máy, Học Sâu, RNN

Bài giới thiệu RNN thứ 3 này được dịch lại từ trang blog WILDML.

Trong phần này tôi sẽ giới thiệu tổng quan về BPTT (Backpropagation Through Time) và giải thích sự khác biệt của nó so với các giải thuật lan truyền ngược truyền thống. Sau đó ta sẽ cùng tìm hiểu vấn đề mất mát đạo hàm (vanishing gradient problem), nó dẫn ta tới việc phát triển của LSTM và GRU - 2 mô hình phổ biến và mạnh mẽ nhất hiện nay trong các bài toán NLP (và cả các lĩnh vực khác).

Đọc tiếp...

[RNN] Cài đặt RNN với Python và Theano

21 tháng 10, 2017 mục Học Máy, Học Sâu, RNN

Bài giới thiệu RNN thứ 2 này được dịch lại từ trang blog WILDML.

Trong phần này chúng ta sẽ cài đặt một mạng nơ-ron hồi quy từ đầu sử dụng Python và tối ưu với Theano - một thư viện tính toán trên GPU. Tôi sẽ chỉ đề cập các thành phần quan trọng để giúp bạn có thể hiểu được RNN, còn toàn bộ mã nguồn bạn có thể xem trên Github.

Đọc tiếp...

[RNN] LSTM là gì?

20 tháng 10, 2017 mục Học Máy, Học Sâu, RNN

Bài LSTM này được dịch lại từ trang colah’s blog.

LSTM là một mạng cải tiến của RNN nhằm giải quyết vấn đề nhớ các bước dài của RNN. Có nhiều bài đã viết về LSTM, nhưng được đề cập tới nhiều và dễ hiểu nhất có lẽ là của anh Christopher Olah. Nên mình quyết định dịch lại cho bản thân có thể hiểu thêm và cho cả các bạn đang tìm hiểu.

Đọc tiếp...

[RNN] RNN là gì?

19 tháng 10, 2017 mục Học Máy, Học Sâu, RNN

Bài giới thiệu RNN này được dịch lại từ trang blog WILDML.

Mạng nơ-ron hồi quy (RNN - Recurrent Neural Network) là một thuật toán được chú ý rất nhiều trong thời gian gần đây bởi các kết quả tốt thu được trong lĩnh vực xử lý ngôn ngữ tự nhiên.

Đọc tiếp...

Trang trước
trang thứ 3 trong 3 trang.

[RNN] Tìm hiểu về giải thuật BPTT và vấn đề mất mát đạo hàm

[RNN] Cài đặt RNN với Python và Theano

[RNN] LSTM là gì?

[RNN] RNN là gì?

Do Minh Hai