Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Geneea: Textová analytika

Podobné prezentace


Prezentace na téma: "Geneea: Textová analytika"— Transkript prezentace:

1 Geneea: Textová analytika
Jiří Hana

2 Problém Dobrý den, včera jsem vybíral z bankomatu na Muzeu a asi jsem zadal špatný pin a bankomat mi kartu sebral. Jak jí získám zpět? Kde si můžu obnovit PIN, zapomněl jsem ho. Naprostá spokojenost na pobočce, paní Zuzana byla profesionální a poradila mi s hypotékou. Banka, ktera se vas pri ruseni uctu ani nezepta, co je duvodem, je na nejrychlejsi ceste do pekel. So long ČSOB, hello Air Bank!

3 Řešení – analyzovat texty strojově
Dobrý den, včera jsem vybíral z bankomatu na Muzeu a asi jsem zadal špatný pin a bankomat mi kartu sebral. Jak jí získám zpět? Kde si můžu obnovit PIN, zapomněl jsem ho. Naprostá spokojenost na pobočce, paní Zuzana byla profesionální a poradila mi s hypotékou. Banka, ktera se vas pri ruseni uctu ani nezepta, co je duvodem, je na nejrychlejsi ceste do pekel. So long Citibank, hello Fio!

4 Řešení – analyzovat texty strojově
Dobrý den, včera jsem vybíral z bankomatu na Muzeu a asi jsem zadal špatný pin a bankomat mi kartu sebral. Jak jí získám zpět? Kde si můžu obnovit PIN, zapomněl jsem ho. 1. Vrácení karty 2. Obnova PIN Naprostá spokojenost na pobočce, paní Zuzana byla profesionální a poradila mi s hypotékou. Profesionalita bankéřky Banka, ktera se vas pri ruseni uctu ani nezepta, co je duvodem, je na nejrychlejsi ceste do pekel. So long Citibank, hello Fio! Odchod ke konkurenci

5

6 Analytika nad textovými daty
Propojení se strukturovanými daty (lokace, CRM, profil) Analýza trendů a anomálií Reporting, vizualizace Zlepšení byznys procesů

7 Entity: Švejk & Phileas Fogg
Characters Places

8 aaa

9

10

11 Pro srovnání:

12 Témata v chatu

13 Témata v chatu

14 Témata v chatu

15 Témata v chatu

16 Interpretor Modules Preparation Grammar Entities Other Discovery
Format conversion Language detection Sentence segmentation Tokenization Correction Grammar Lemmatization Morphological tagging Syntax structure Entities Discovery Standardization Disambiguation Other Relations Sentiment Categorization

17 Production Deployment – AWS
Interpretor (Elastic Beanstalk) Knowledgebase PostgreSQL (RDS) Graylog (EC2 instance) REST API HTTPS Virtual Private Cloud Interpretor: Tomcat, Java8, Spring, Hibernate r4.xlarge instances Immutable, rolling release deployments Load balanced, auto-scaling (CPU utilization) RDS: db.t2.medium, SSD 10GB Knowledgebase: Docker, Python 3.6, Flask, Gunicorn, psycopg2 t2.micro instances RDS: db.t2.medium, SSD 128GB, auto-backups

18 Production Deployment – Azure
Virtual Private Network Orion Solr Node Pavo Taurus Lyra Nginx Franz Frida SQL Data Virtual Machines: 2xCPU, 7GB RAM, 128GB SSD, CentOS 7.2 Solr Cluster: Solr 6.2, Java8, 4GB heap size Zookeeper on each machine ~100 collections, 2 replicas each Cluster still operational with one node down Franz Service: Python 3.6, gunicorn (4 workers), sqlite3 Frida: node.js, bootstrap, angular

19 FAQ, Knowledge base, email answers
[ ] + ? ? Format Conversion Similarity search Doc Structure Analysis 1. 2. Document Database (Franz) 3. [ ] + Text Analysis (Interpretor)


Stáhnout ppt "Geneea: Textová analytika"

Podobné prezentace


Reklamy Google