Làm cách nào để sử dụng Google NLP API trong Python?

Chào mừng bạn đến với phần 4 của loạt bài hướng dẫn về Google Cloud. Trong phần này, chúng ta sẽ khám phá một số API ngôn ngữ tự nhiên. Chúng tôi sẽ tập trung vào nhận dạng thực thể và phân tích tình cảm, nhưng bạn cũng có thể thực hiện phân tích cú pháp với API này

Như thường lệ, bạn sẽ cần phải bật API này và tất nhiên là phải thiết lập thông tin đăng nhập API như chúng ta đã làm trong Phần 2

Từ đây, mọi thứ sẽ bắt đầu trở nên quen thuộc với các API, ví dụ: chúng ta sẽ có client = language.Client[], sau đó chúng ta sẽ nhận được tất cả các loại phương thức mà chúng ta có thể thực hiện với một số đầu vào, trong trường hợp này, sẽ là văn bản. Ví dụ

from google.cloud import language

def language_analysis[text]:
    client = language.Client[]
    document = client.document_from_text[text]
    sent_analysis = document.analyze_sentiment[]
    dir[sent_analysis]
    sentiment = sent_analysis.sentiment

    ent_analysis = document.analyze_entities[]
    dir[ent_analysis]
    entities = ent_analysis.entities

    return sentiment, entities


example_text = 'Python is such a great programming language'
sentiment, entities = language_analysis[example_text]
print[sentiment.score, sentiment.magnitude]
for e in entities:
    print[e.name, e.entity_type, e.metadata, e.salience]

Chạy cái này

[0.8, 0.8]
[u'Python', u'ORGANIZATION', {u'mid': u'/m/05z1_', u'wikipedia_url': u'//en.wikipedia.org/wiki/Python_[programming_language]'}, 0.84221077]
[u'programming language', u'OTHER', {}, 0.1577892]

Chúng ta đã làm được khá nhiều ở đây, vì vậy hãy chia nhỏ nó ra

Đầu tiên, chúng tôi có được tình cảm và cường độ tình cảm. Tình cảm được cho điểm trong khoảng từ -1 đến +1 và độ lớn của tình cảm là không giới hạn, từ 0 trở đi. Tình cảm là cảm xúc, và độ lớn là sức mạnh của cảm xúc đó

Vì vậy, trong trường hợp trên, chúng tôi có 0. 8 tình cảm, và 0. 8 độ, vì vậy tình cảm tích cực và độ lớn tích cực

Tiếp theo, chúng ta có thể thấy rằng chúng ta chạy qua các thực thể. Chúng ta có thể thấy rằng hai đã được tìm thấy, "Python" và "ngôn ngữ lập trình. " Đối với mỗi thực thể, chúng tôi in ra tên của chúng, loại thực thể, bất kỳ siêu dữ liệu nào mà chúng tôi có thể tìm thấy và sau đó là phần nổi bật

Các loại thực thể được hiển thị cho đến nay là tổ chức và loại khác, ngoài ra còn có các loại thực thể khác, chẳng hạn như địa điểm và người. Sau đó, chúng tôi nhận được siêu dữ liệu, sẽ chứa bất kỳ thông tin bổ sung nào nếu có bất kỳ thông tin nào đã biết. Ví dụ: đối với thực thể Python, chúng tôi lấy trang wikipedia cho ngôn ngữ lập trình Python. Cuối cùng, chúng ta có được độ nổi bật, đây là thước đo tầm quan trọng của thực thể này trong toàn bộ tài liệu. Như chúng ta có thể thấy, "Python" ở đây là một chủ đề "quan trọng" hơn nhiều so với "ngôn ngữ lập trình"

Lấy một vài đoạn đầu tiên từ trang wikipedia lập trình Python, hãy xem kết quả là gì

from google.cloud import language

def language_analysis[text]:
    client = language.Client[]
    document = client.document_from_text[text]
    sent_analysis = document.analyze_sentiment[]
    dir[sent_analysis]
    sentiment = sent_analysis.sentiment

    ent_analysis = document.analyze_entities[]
    dir[ent_analysis]
    entities = ent_analysis.entities

    return sentiment, entities


example_text = '''Python is a widely used high-level programming language for general-$

Python features a dynamic type system and automatic memory management and supports mul$

Python interpreters are available for many operating systems, allowing Python code to $

sentiment, entities = language_analysis[example_text]
print[sentiment.score, sentiment.magnitude]
for e in entities:
    print[e.name, e.entity_type, e.metadata, e.salience]
[0.3, 2.6]
[u'Python', u'ORGANIZATION', {u'mid': u'/m/05z1_', u'wikipedia_url': u'//en.wikipedia.org/wiki/Python_[programming_language]'}, 0.56117535]
[u'programming', u'OTHER', {}, 0.07085185]
[u'programming language', u'OTHER', {}, 0.06715261]
[u'CPython', u'CONSUMER_GOOD', {u'mid': u'/m/06bxxb', u'wikipedia_url': u'//en.wikipedia.org/wiki/CPython'}, 0.0427983]
[u'Guido van Rossum', u'PERSON', {u'mid': u'/m/01h05c', u'wikipedia_url': u'//en.wikipedia.org/wiki/Guido_van_Rossum'}, 0.028725443]
[u'syntax', u'OTHER', {}, 0.020441024]
[u'language', u'OTHER', {}, 0.019001]
[u'whitespace indentation', u'OTHER', {}, 0.01484696]
[u'programs', u'OTHER', {}, 0.010850109]
[u'language', u'OTHER', {}, 0.010392293]
[u'code readability', u'OTHER', {}, 0.009924238]
[u'code blocks', u'OTHER', {}, 0.009924238]
[u'braces', u'CONSUMER_GOOD', {}, 0.009924238]
[u'code', u'OTHER', {}, 0.009277556]
[u'languages', u'OTHER', {}, 0.009277556]
[u'design philosophy', u'OTHER', {}, 0.008008728]
[u'type system', u'OTHER', {}, 0.007276746]
[u'lines', u'OTHER', {}, 0.006710995]
[u'C++', u'OTHER', {}, 0.006710995]
[u'concepts', u'OTHER', {}, 0.006710995]
[u'keywords', u'OTHER', {}, 0.006710995]
[u'programmers', u'PERSON', {}, 0.006071727]
[u'constructs', u'OTHER', {}, 0.005694318]
[u'memory management', u'OTHER', {}, 0.005694318]
[u'programming paradigms', u'OTHER', {}, 0.005694318]
[u'systems', u'OTHER', {}, 0.0054415334]
[u'variety', u'OTHER', {}, 0.004914569]
[u'Java.', u'LOCATION', {u'mid': u'/m/07sbkfb', u'wikipedia_url': u'//en.wikipedia.org/wiki/Java_[programming_language]'}, 0.004136519]
[u'functional programming', u'OTHER', {}, 0.003754759]
[u'variant implementations', u'OTHER', {}, 0.0035818678]
[u'code', u'OTHER', {}, 0.0032084463]
[u'all', u'OTHER', {}, 0.0031023393]
[u'operating systems', u'OTHER', {}, 0.0029644007]
[u'development model', u'OTHER', {}, 0.002501432]
[u'Python interpreters', u'PERSON', {}, 0.0023183578]
[u'styles', u'OTHER', {}, 0.0023183578]
[u'Python Software Foundation', u'ORGANIZATION', {u'mid': u'/m/033l1p', u'wikipedia_url': u'//en.wikipedia.org/wiki/Python_Software_Foundation'}, 0.0019105236]

Chúng tôi có thêm một số thực thể ở đây, nhiều thực thể trong số đó có siêu dữ liệu và tất nhiên tất cả đều có tính chất nổi bật, đó cũng là thứ mà tất cả các thực thể hiện được sắp xếp theo

NLP được sử dụng như thế nào trong Google?

Xử lý ngôn ngữ tự nhiên [NLP] sử dụng máy học để tiết lộ cấu trúc và ý nghĩa của văn bản . Với các ứng dụng xử lý ngôn ngữ tự nhiên, các tổ chức có thể phân tích văn bản và trích xuất thông tin về con người, địa điểm và sự kiện để hiểu rõ hơn về cảm xúc trên mạng xã hội và các cuộc trò chuyện của khách hàng.

Google có API Python không?

Ứng dụng API của Google . Đây là thư viện máy khách Google API Python dành cho các API dựa trên khám phá của Google.

API ngôn ngữ tự nhiên của Google Cloud là gì?

Cloud Natural Language API cung cấp các công nghệ hiểu ngôn ngữ tự nhiên cho nhà phát triển, bao gồm phân tích tình cảm, phân tích thực thể, phân tích tình cảm thực thể, phân loại nội dung và phân tích cú pháp. API này là một phần của họ Cloud Machine Learning API lớn hơn

Việc sử dụng NL Cloud API là gì?

API ngôn ngữ tự nhiên trên đám mây là một dịch vụ của Google cung cấp giao diện cho một số mô hình NLP đã được đào tạo về kho văn bản lớn. API có thể được sử dụng để phân tích thực thể, phân tích cú pháp, phân loại văn bản và phân tích cảm tính .

Chủ Đề