Przetwarzanie języka naturalnego

Przetwarzanie języka naturalnego

Ocena tego kursu:

Rated 5 out of 5

Dlaczego kurs

Przetwarzanie języka naturalnego?

Kurs przekrojowo omawia tematykę przetwarzania języka naturalnego – od wprowadzenia teoretycznego, przez wykorzystanie najnowszych metod uczenia maszynowego, aż po zastosowania praktyczne.

Przetwarzanie języka naturalnego to obecnie jeden z najszybciej rozwijających się obszarów Sztucznej Inteligencji, dzięki czemu stale powiększa się zakres zastosowań metod NLP w praktyce – w nauce, biznesie i codziennym życiu. Zdobywając kompetencje z tego obszaru, stajesz się jedną z najbardziej poszukiwanych osób na rynku pracy, a także otwierasz sobie furtkę do samodzielnej pracy biznesowej na perspektywicznym rynku. Jest to też okazja do tego, by jednocześnie zdobyć kompetencje w obszarze ogólnej Sztucznej Inteligencji, a więc poznać metody analizy danych, uczenia maszynowego, a także sieci neuronowe i deep learning

Co będę umieć gdy zrobię cały kurs

z Przetwarzania Języka Naturalnego?

  • Będziesz w stanie podjąć pracę w obszarze przetwarzania języka naturalnego lub – znając problematykę i specyfikę tego obszaru – rozwijać własne przedsięwzięcia biznesowe w tym obszarze. 
  • Będziesz posiadać unikalne kompetencje, pozwalające Ci podejmować projekty związane z obszarem analizy danych, sztucznej inteligencji i przetwarzania języka naturalnego – w szczególności języka polskiego.

Co otrzymam, kupując kurs?

Otrzymasz unikalny, kompleksowy kurs, który omawia zarówno niezbędne podstawy w zakresie metody analizy danych i uczenia maszynowego, jak i najbardziej aktualne zagadnienia z obszaru przetwarzania języka naturalnego. Kurs jest unikalny, ponieważ zawiera specyficzną wiedzę na temat przetwarzania języka polskiego, pochodzącą od najlepszych ekspertów z tego obszaru – twórców poszczególnych metod, modeli i zbiorów danych.
 

ZALEŻY NAM NA REALNYM EFEKCIE

Czy kurs

Przetwarzania języka naturalnego

przeznaczony jest dla Ciebie?

TAK jeśli...

  • znasz podstawową znajomość języka Python, wraz z pakietami numpy i pandas
  • mile widziana podstawowa znajomość kwestii statystycznej analizy danych i uczenia maszynowego

Dlaczego warto wybrać ten kurs?

Najlepsi eksperci

Twórcami i prowadzącymi kurs NLP

40 godzin

Nagrań z teorii i praktyki

Ćwiczenia

Do samodzielnego wykonania

Zamknięta grupa dyskusyjna

Konsultacja w dowolnym momencie

Program

1. Wprowadzenie

  • Czym jest Przetwarzanie języka naturalnego (NLP)?
  • Dlaczego warto się tym zajmować i dlaczego właśnie teraz?
  • Co stanowi największe wyzwanie w NLP?
  • Najciekawsze zastosowania NLP
  • Co jest potrzebne, aby zajmować się NLP (narzędzia, algorytmy, matematyka)
  •  

2. Czy maszyny mogą zrozumieć język naturalny?

  • Poziomy analizy języka naturalnego
  • Jak analizować język mówiony?
  • Jak maszyna “widzi” tekst?
  • Potoki przetwarzania
  • Architektura rozwiązań NLP

3. Podstawy: słowa, zdania i dokumenty

  • Tokenizacja: podział tekstu na słowa
  • Stemming i lematyzacja
  • Reprezentacja bag-of-words
  • Odległość edycyjna
  • Wyrażenia regularne
  • N-gramy
  • Podział na zdania
  • TF-IDF
  •  
  • Regularyzacja modelu

4. Nieco lingwistyki: znakowanie morfosyntaktyczne i gramatyki

  • Zasoby językowe
  • Analiza morfosyntaktyczna
  • Znakowanie morfosyntaktyczne
  • Gramatyki
  • Rozkład zależnościowy

5. Podstawy uczenia maszynowego w NLP

  • Uczenie nadzorowane a nienadzorowane
  • Latent Semantic Indexing (LSI)
  • Liniowa analiza dyskryminacyjna (LDA)
  • Regresja logistyczna
  • Typowe algorytmy uczenia maszynowego: Naive Bayes, SVM, CRF

6. Zastosowania I

  • Indeksowanie i przeszukiwanie tekstu
  • Grupowanie i klasyfikacja tekstów (podejścia ML)
  • Ujednoznacznianie sensu słów (word sense disambiguation)
  • Rozpoznawanie jednostek nazewniczych (named entity recognition)

7. Sieci neuronowe

  • Najprostsza sieć neuronowa
  • Czym jest głębokie uczenie (deep learning)?
  • Reprezentacje wektorowe (zanurzenia słów i dokumentów)
    • word2vec, glove, elmo
    • doc2vec
  • Sieci RNN
  • Sieci CNN
  • Sieci LSTM
  • Mechanizm uwagi i modele typu Encoder-Decoder
  • Typowe architektury sieci i wykorzystanie pretrenowanych modeli
    • BERT, RoBERTa, DistillBERT
    • GPT, GPT-2, GPT-3
    • XLM
    • Transformers

8. Zastosowania II

  • Grupowanie i klasyfikacja tekstów (podejścia DL)
  • Ekstrakcja informacji (information extraction)
  • Wyszukiwanie semantyczne w tekście
  • Analiza wydźwięku (sentiment analysis)
  • Systemy dialogowe (chatboty)
  • Analiza koreferencji (coreference analysis)
  • Tworzenie podsumowań (summarization)

9. Rozpoznawanie mowy

  • Opis problemu
  • Historia i różne podejścia
    • izolowane/regułowe, HMM, WFST, hybrydowe, E2E
  • Wprowadzenie do modelowania akustycznego
  • Modelowanie języka w rozpoznawaniu mowy
    • gramatyki formalne
    • statystyczne modele języka
  • Dekodowanie w rozpoznawaniu mowy
    • n-best i kraty
    • rescoring i wykorzystanie NNLM

10. Zakończenie

  • Ciekawe zasoby
    • materiały edukacyjne
    • zasoby dla języka polskiego
    • konkursy: SemEval, PolEval, GLUE, KLEJ
  • Dalsze kroki
  • Obiecujące kierunki badawcze

Autorzy kursu Przetwarzanie języka naturalnego

dr inż. Łukasz Kobyliński
dr inż. Łukasz Kobyliński

Chief Science Officer w Sages, Data Scientist w SigDelta oraz adiunkt w Instytucie Podstaw Informatyki PAN. Uczestnik takich konferencji, jak PKDD, LREC, TSD, czy LTC. Pracował w projektach komercyjnych związanych z ekstrakcją informacji, agentami dialogowymi, czy odpowiadaniem na pytania.

dr hab. Piotr Pęzik
dr hab. Piotr Pęzik

Profesor UŁ w Instytucie Anglistyki, autor prac naukowych i rozwiązań informatycznych z dziedziny językoznawstwa korpusowego i komputerowego. Obszarem jego zainteresowań językoznawczych jest frazeologia dystrybucyjna w ujęciu korpusowym. Był wykonawcą i kierownikiem krajowych i europejskich projektów badawczo-rozwojowych, m.in. NKJP, CESAR, PLEC, BootStrep.

dr inż. Michał Marcińczuk
dr inż. Michał Marcińczuk

Adiunkt w Katedrze Inteligencji Obliczeniowej na Wydziale Informatyki i Zarządzania Politechniki Wrocławskiej. Posiada rozległe doświadczenie w zakresie ekstrakcji informacji, automatyzacji wyszukiwania danych tekstowych, rozpoznawania jednostek nazewniczych, czy ujednoznaczniania sensu słów.

dr inż. Danijel Koržinek
dr inż.Danijel Korzinek

Adiunkt w Polsko-Japońskiej Akademii Technik Komputerowych. Wykonawca w wielu projektach naukowych i badawczo rozwojowych, w tym CLARIN-PL, EU-Bridge, SYNAT, SENAT, czy LUNA. Autor i współautor ponad 20 artykułów naukowych.

dr Alina Wróblewska
dr Alina Wróblewska

Adiunkt w Zespole Inżynierii Lingwistycznej Instytutu Podstaw Informatyki PAN. Specjalistka w dziedzinie morfoskładniowego oraz semantycznego przetwarzania języka naturalnego, w szczególności parsowania zależnościowego oraz semantyki wektorowej. Posiada doświadczenie w tworzeniu zasobów do trenowania modeli NLP. Wyniki swoich badań naukowych prezentowała na konferencjach, m.in. ACL, EMNLP, LREC.

Patryk Pilarski
Patryk Pilarski

Data scientist i trener z kilkuletnim doświadczeniem. Pracuje z danymi w każdym rozmiarze i kształcie – od dużych po małe, od liczb po tekst. Nieustannie poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych.

Ryszard Tuora
Ryszard Tuora

Współpracuje z Instytutem Podstaw Informatyki PAN. Zajmował się implementacją modelu dla języka polskiego do popularnego frameworku NLP – spaCy. Jego zainteresowania naukowe obejmują gramatyki zależnościowe, semantykę dystrybucyjną, oraz analizę zależności logicznych w tekstach. Pracował komercyjnie przy rozwijaniu narzędzi do przetwarzania i klasyfikacji tekstów, agentach dialogowych i popularyzacji NLP.

EKSPERCKI PROGRAM ROZWOJOWY STWORZYLIŚMY Z MYŚLĄ O BUDOWANIU NAJLEPSZYCH KADR IT

Dlaczego warto zainwestować w kurs
Przetwarzanie języka naturalnego

Przekrojowość

Ten kurs, to wszystko, czego potrzebujesz, żeby rozpocząć pracę z analizą języka naturalnego. Zakres kursu pokrywamy 80% typowych zastosowań praktycznych NLP, wprowadzając niezbędne elementy statystyki, wiedzy lingwistycznej, czy też aspektów związanych z uczeniem maszynowym.

Dostosowanie do języka polskiego

W przeciwieństwie do większości innych dostępnych materiałów, ten kurs dotyczy przetwarzania zarówno języka angielskiego jak i polskiego. Omawiamy niezbędne narzędzia, zasoby i różnice w stosunku do języka angielskiego, które są niezbędne do rozpoczęcia pracy z językiem polskim.

Aktualna wiedza

Kurs uwzględnia najnowsze metody stosowane w przetwarzaniu języka naturalnego. Omawiamy kwestie związane z reprezentacjami wektorowymi słów i dokumentów, głębokim uczeniem maszynowym, w tym architekturami RNN, LSTM i CNN, a także podejścia oparte na uwadze.

Podbudowa teoretyczna

Kurs Przetwarzanie języka naturalnego – choć bardzo praktyczny – zbudowany jest na bazie ugruntowanej wiedzy teoretycznej dotyczącej lingwistyki komputerowej. Wszystkie prezentowane rozwiązania poparte są recenzowanymi publikacjami naukowymi i są szeroko stosowane zarówno w środowisku naukowym, jak i w rozwiązaniach komercyjnych.

Przystępny przekaz

nawet zaawansowane zagadnienia będą omówienia w sposób klarowny, pozwalający na rzetelne zrozumienie całej dziedziny

Eksperci

W trakcie kursu poszczególne zagadnienia specjalistyczne omawiane są przez zaproszonych gości – ekspertów z poszczególnych tematów. Zaprosiliśmy autorów najlepszych rozwiązań, osoby z długoletnim doświadczeniem w pracy nad poszczególnymi tematami – tak, aby dostarczyć Wam wiedzę z najlepszego możliwego źródła.

Wykup dostęp do kursu

BASIC

1999,00 
  • 40 godzin nagrań
  • Ćwiczenia do samodzielnego wykonania
  • Zamknięta grupa dyskusyjna Gitter
  • Certyfikat
  • Dożywotni dostęp do platformy
  • 14 dni na zwrot

PAKIET DLA FIRM

INDYWIDUALNA WYCENA
  • Tryb zajęć dostosowany do potrzeb twojego zespołu
  • Masz możliwość połączenia kursu z warsztatami na żywo z trenerem w metodologii blended learning
  • Zakres oraz rozkład szkolenia w czasie, w pełni dostosowany do potrzeb Twojego zespołu

Inni kupili również:

FAQ

Czy otrzymam od razu dostęp do całego kursu?

Tak, otrzymujesz dostęp od razu do całego kursu po zakupie.

Czy mogę zrezygnować z kursu po zakupie i dokonaniu płatności?

Oczywiście.  Dajemy Ci gwarancję sprawdzenia jakości kursu przez 14 dni od momentu otrzymania dostępu do kursu. Oznacza to, że jeśli zgłosisz się do nas w określonym terminie z informacją, że kurs nie spełnił Twoich oczekiwań, oddamy Ci w całości wpłacona kwotę.

W jakiej formie jest kurs?

Kurs jest w formie wideo. Nagrania zamieszczone są na platformie e-learningowej, do której otrzymujesz indywidualny dostęp. Poza nagraniami wideo dostępne są pliki do pobrania (kod źródłowy, slajdy, pliki tekstowe, odnośniki do zewnętrznych materiałów, testy, etc.). Po każdej lekcji otrzymasz pakiet zadań dodatkowych, które możesz rozwiązać samodzielnie.

Jak długo będę mieć dostęp do materiałów programu i społeczności tworzonej przez grono uczestników?

Otrzymasz dożywotni (a raczej tak długo jak będzie istniał kurs) dostęp do tej edycji kursu, wszystkich materiałów w niej zawartych, przyszłych aktualizacji oraz społeczności (platforma Gitter).

Co wyróżnia kurs w trybie masterclass od e-learningu?

W trybie masterclass masz poczucie, że realizujesz kurs z grupą i nie zostajesz sam z problemem. W trakcie trwania całego kursu zorganizowane zostaną cztery spotkania z autorem kursu, podczas których będziesz mógł omówić interesujące Ciebie zagadnienia.

Bazując na doświadczeniach, opracowaliśmy format i plan kursu, który skutecznie motywuje Cię do systematycznego działania i w rezultacie efektywnie przybliża do założonego celu.

Masz pytania? Napisz do nas!

Zaloguj się
Darmowa rejestracja
Resetowanie hasła
[reset_password]