Hướng dẫn python count words in list - python đếm từ trong danh sách
Bạn có thể dùng Show
Nó hỗ trợ Python 2.7 , Đọc thêm thông tin tại đây 1.
Sử dụng dict
Nhưng, bạn phải đọc tập tin trước và chuyển đổi thành Dict. 2. Đó là ví dụ về tài liệu Python, sử dụng RE và truy cập
Trong hướng dẫn này, bạn sẽ học cách sử dụng Python để đếm số lượng từ và tần số từ trong cả chuỗi và tệp văn bản. Có thể đếm các từ và tần số từ là một kỹ năng hữu ích. Ví dụ, biết cách làm điều này có thể quan trọng trong các thuật toán học máy phân loại văn bản.you’ll learn how to use Python to count the number of words and word frequencies in both a string and a text file. Being able to count words and word frequencies is a useful skill. For example, knowing how to do this can be important in text classification machine learning algorithms. Đến cuối hướng dẫn này, bạn sẽ học được:
Đọc một tệp văn bản trong PythonĐếm số lượng từ trong python bằng cách sử dụng split () Đếm số lượng từ trong python bằng regex
Tính toán tần số từ trong Python Đếm số lượng từ trong python bằng cách sử dụng split ()Đếm số lượng từ trong python bằng regex
Tính toán tần số từ trong Python
Các quy trình để đếm các từ và tính toán các tần số từ được hiển thị bên dưới là giống nhau cho dù bạn đang xem xét một chuỗi hay toàn bộ tệp văn bản. Bởi vì điều này, phần này sẽ mô tả ngắn gọn cách đọc một tệp văn bản trong Python.
Đếm số lượng từ trong python bằng regexTính toán tần số từ trong Python Các quy trình để đếm các từ và tính toán các tần số từ được hiển thị bên dưới là giống nhau cho dù bạn đang xem xét một chuỗi hay toàn bộ tệp văn bản. Bởi vì điều này, phần này sẽ mô tả ngắn gọn cách đọc một tệp văn bản trong Python. Nếu bạn muốn có một hướng dẫn chuyên sâu hơn về cách đọc tệp văn bản trong Python, hãy xem hướng dẫn này ở đây. Dưới đây là một đoạn mã nhanh mà bạn có thể sử dụng để tải nội dung của tệp văn bản vào chuỗi Python: Tôi khuyến khích bạn kiểm tra hướng dẫn để tìm hiểu lý do và cách tiếp cận này hoạt động. Tuy nhiên, nếu bạn vội vàng, chỉ cần biết rằng quá trình mở tệp, đọc nội dung của nó và sau đó đóng lại tệp.
Tính toán tần số từ trong PythonĐể tính toán tần số từ, chúng ta có thể sử dụng lớp DefaultDICT hoặc lớp truy cập. Tần số từ đại diện cho tần suất một từ nhất định xuất hiện trong một đoạn văn bản. Sử dụng DefaultDict để tính toán tần số từ trong pythonHãy để xem cách chúng ta có thể sử dụng DefaultDict để tính toán tần số từ trong Python. DefaultDICT mở rộng từ Từ điển Python thông thường bằng cách cung cấp các chức năng hữu ích để khởi tạo các khóa bị thiếu. Bởi vì điều này, chúng ta có thể lặp qua một đoạn văn bản và đếm các sự xuất hiện của mỗi từ. Hãy để xem cách chúng ta có thể sử dụng nó để tạo tần số từ cho một chuỗi đã cho:
Hãy để phá vỡ những gì chúng tôi đã làm ở đây:
Sử dụng bộ đếm để tạo tần số từ trong PythonMột cách khác để làm điều này là sử dụng lớp 3. Lợi ích của phương pháp này là chúng ta thậm chí có thể dễ dàng xác định từ thường xuyên nhất. Hãy để xem cách chúng ta có thể sử dụng phương pháp này: 0Hãy để phá vỡ những gì chúng tôi đã làm ở đây:
Sử dụng bộ đếm để tạo tần số từ trong Python 1Một cách khác để làm điều này là sử dụng lớp >>>d={1:'one', 2:'one', 3:'two'} >>>c = Counter(d.values()) [('one', 2), ('two', 1)] 3. Lợi ích của phương pháp này là chúng ta thậm chí có thể dễ dàng xác định từ thường xuyên nhất. Hãy để xem cách chúng ta có thể sử dụng phương pháp này:Chúng tôi đã nhập các thư viện và lớp học bắt buộc của chúng tôi Chúng tôi đã chuyển danh sách kết quả từ hàm >>>c = Counter('abracadabra') >>>c.most_common(3) [('a', 5), ('r', 2), ('b', 2)] 5 vào lớp >>>d={1:'one', 2:'one', 3:'two'} >>>c = Counter(d.values()) [('one', 2), ('two', 1)] 3Chúng tôi đã in kết quả của lớp này
|