Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

Tôi đang cố gắng nhập cảnh đẹp trong Python3. Tôi có dòng này:

Show
from bs4 import BeautifulSoup

Nó nói rằng:

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax

Tôi thấy rằng nó vẫn đang cố gắng sử dụng gói Python2.7. Tôi đã cài đặt đẹp cho Python3 bằng PIP3 và khi kiểm tra tôi thấy rằng gói có trong/usr/lib/python3/dist-packages/. Ngoài ra khi kiểm tra sys.path, tôi thấy rằng con đường này có mặt. Tôi vẫn không hiểu tại sao nó đang cố gắng sử dụng gói cũ hơn,
Also on checking sys.path, I found that this path is present. Still I don't get why it is trying to use the older package,

Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

JFS

386K183 Huy hiệu vàng950 Huy hiệu bạc1626 Huy hiệu Đồng183 gold badges950 silver badges1626 bronze badges

Đã hỏi ngày 22 tháng 2 năm 2015 lúc 5:44Feb 22, 2015 at 5:44

Nishantsinghnhantsinghnishantsingh

4.3974 Huy hiệu vàng24 Huy hiệu bạc49 Huy hiệu đồng4 gold badges24 silver badges49 bronze badges

2

Nếu

['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
1 thực thi có
['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
2 trong
['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
3 thì điều đó có nghĩa là cài đặt Python 3 bị hỏng.

Đây là

['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
3 trên máy của tôi:

['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']

Lưu ý: Không có thư mục

['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
2.

Hãy chắc chắn rằng

['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
6 không được đặt và không có tệp
['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
7 đi lạc trong danh sách mặc định (phụ thuộc vào cài đặt, ở trên) của các thư mục Python 3.4 đề cập đến các thư mục Python2.7 và tệp
['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
8 hoặc
['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
9,
$sudo apt-get install python-pip
0

Đã trả lời ngày 22 tháng 2 năm 2015 lúc 10:56Feb 22, 2015 at 10:56

Có lẽ sử dụng VirtualEnv có thể tạm thời giải quyết vấn đề của bạn. Hoặc có thể thử

$sudo apt-get install python-pip
2 theo cách đó bạn chỉ còn lại với phiên bản PIP3 được cài đặt.

Đã trả lời ngày 22 tháng 2 năm 2015 lúc 8:32Feb 22, 2015 at 8:32


Bây giờ hãy để chúng tôi hiểu thêm về món súp súp trên ví dụ trên.

Vì BeautifulSoup không phải là một thư viện Python tiêu chuẩn, chúng ta cần cài đặt nó trước. Chúng tôi sẽ cài đặt thư viện BeautifulSoup 4 (còn được gọi là BS4), đây là mạng mới nhất.

Để cô lập môi trường làm việc của chúng tôi để không làm phiền thiết lập hiện có, trước tiên chúng ta hãy tạo ra một môi trường ảo.

Tạo môi trường ảo (tùy chọn)

Một môi trường ảo cho phép chúng tôi tạo một bản sao Python làm việc bị cô lập cho một dự án cụ thể mà không ảnh hưởng đến thiết lập bên ngoài.

Cách tốt nhất để cài đặt bất kỳ máy gói Python nào là sử dụng PIP, tuy nhiên, nếu PIP chưa được cài đặt (bạn có thể kiểm tra nó bằng cách sử dụng - PIP PIP, trong lệnh nhắc lệnh hoặc shell của bạn), bạn có thể cài đặt bằng cách đưa ra lệnh bên dưới -

$sudo apt-get install python-pip

Môi trường Linux

Môi trường Windows

  • Để cài đặt PIP trong các cửa sổ, hãy thực hiện các phần sau -

  • Tải xuống get-pip.py từ https://bootstrap.pypa.io/get-pip.py hoặc từ github đến máy tính của bạn.

  • Mở dấu nhắc lệnh và điều hướng đến thư mục chứa tệp get-pip.py.

>python get-pip.py

Chạy lệnh sau -

Đó là nó, PIP hiện được cài đặt trong máy Windows của bạn.

>pip --version
pip 19.2.3 from c:\users\yadur\appdata\local\programs\python\python37\lib\site-packages\pip (python 3.7)

Bạn có thể xác minh PIP của mình được cài đặt bằng cách chạy lệnh bên dưới -

Cài đặt môi trường ảo

>pip install virtualenv

Chạy lệnh bên dưới trong dấu nhắc lệnh của bạn -

Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

Sau khi chạy, bạn sẽ thấy ảnh chụp màn hình dưới đây -

>virtualenv myEnv

Lệnh dưới đây sẽ tạo ra một môi trường ảo (MY MYENV) trong thư mục hiện tại của bạn -

Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

Ảnh chụp màn hình

Để kích hoạt môi trường ảo của bạn, hãy chạy lệnh sau -

Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

________số 8

Trong ảnh chụp màn hình ở trên, bạn có thể thấy chúng tôi có tiền tố là tiền tố cho chúng tôi biết rằng chúng tôi đang ở trong môi trường ảo.

(myEnv) C:\Users\yadur>deactivate
C:\Users\yadur>

Để ra khỏi môi trường ảo, chạy vô hiệu hóa.

Vì môi trường ảo của chúng tôi đã sẵn sàng, bây giờ chúng ta hãy cài đặt đẹp.

Cài đặt đẹp

Vì BeautifulSoup không phải là một thư viện tiêu chuẩn, chúng tôi cần cài đặt nó. Chúng tôi sẽ sử dụng gói xinh đẹp 4 (được gọi là BS4).

Máy Linux

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
0

Để cài đặt BS4 trên Debian hoặc Ubuntu Linux bằng Trình quản lý gói hệ thống, hãy chạy lệnh bên dưới -

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
1

Bạn có thể cài đặt BS4 bằng Easy_install hoặc PIP (trong trường hợp bạn tìm thấy sự cố trong việc cài đặt bằng cách sử dụng hệ thống Packager).

(Bạn có thể cần sử dụng Easy_Install3 hoặc PIP3 tương ứng nếu bạn sử dụng python3)

Máy Windows

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
2

Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

Để cài đặt BeautifulSoup4 trong Windows rất đơn giản, đặc biệt nếu bạn đã cài đặt PIP.

Vì vậy, bây giờ BeautifulSoup4 đã được cài đặt trong máy của chúng tôi. Hãy để chúng tôi nói về một số vấn đề gặp phải sau khi cài đặt.

Vấn đề sau khi cài đặt

  • Trên máy Windows bạn có thể gặp phải, phiên bản sai được cài đặt lỗi chủ yếu thông qua -ImportError “No module named HTMLParser”, then you must be running python 2 version of the code under Python 3.

  • Lỗi: ItrongRor không có mô -đun có tên HTMLPARSER, sau đó bạn phải chạy phiên bản Python 2 của mã theo Python 3.ImportError “No module named html.parser” error, then you must be running Python 3 version of the code under Python 2.

Lỗi: IrtUterror không có mô -đun có tên HTML.PARTHER Lỗi, sau đó bạn phải chạy phiên bản Python 3 của mã theo Python 2.

Cách tốt nhất để thoát khỏi hai tình huống trên là cài đặt lại BeautifulSoup một lần nữa, loại bỏ hoàn toàn cài đặt hiện có.SyntaxError “Invalid syntax” on the line ROOT_TAG_NAME = u’[document]’, then you need to convert the python 2 code to python 3, just by either installing the package −

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
3

Nếu bạn nhận được cú pháp không hợp lệ của Syntaxerror trên dòng root_tag_name = U, [tài liệu], thì bạn cần chuyển đổi mã Python 2 thành Python 3, chỉ bằng cách cài đặt gói -

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
4

hoặc bằng cách chạy thủ công, tập lệnh chuyển đổi Python từ 2 đến 3 trên thư mục BS4 -

Cài đặt trình phân tích cú pháp

Theo mặc định, súp đẹp hỗ trợ trình phân tích cú pháp HTML có trong thư viện tiêu chuẩn Python, tuy nhiên nó cũng hỗ trợ nhiều trình phân tích cú pháp Python bên ngoài như trình phân tích cú pháp LXML hoặc trình phân tích cú pháp HTML5LIB.

Vì BeautifulSoup không phải là một thư viện tiêu chuẩn, chúng tôi cần cài đặt nó. Chúng tôi sẽ sử dụng gói xinh đẹp 4 (được gọi là BS4).

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
5

(Bạn có thể cần sử dụng Easy_Install3 hoặc PIP3 tương ứng nếu bạn sử dụng python3)

Máy Windows

Hướng dẫn how do i import a beautifulsoup in python 3? - làm cách nào để nhập một tệp beautifulsoup trong python 3?

Để cài đặt BeautifulSoup4 trong Windows rất đơn giản, đặc biệt nếu bạn đã cài đặt PIP.

Vì vậy, bây giờ BeautifulSoup4 đã được cài đặt trong máy của chúng tôi. Hãy để chúng tôi nói về một số vấn đề gặp phải sau khi cài đặt.

Vấn đề sau khi cài đặt

Trong mã dưới đây, chúng tôi đang cố gắng trích xuất tiêu đề từ trang web -

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
7

Đầu ra

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
8

Một nhiệm vụ phổ biến là trích xuất tất cả các URL trong một trang web. Cho rằng chúng ta chỉ cần thêm dòng mã bên dưới -

from bs4 import BeautifulSoup
File "/usr/local/lib/python2.7/dist-packages/bs4/__init__.py", line 175
except Exception, e:
                ^
SyntaxError: invalid syntax
9

Đầu ra

['',
 '/usr/lib/python3.4',
 '/usr/lib/python3.4/plat-x86_64-linux-gnu',
 '/usr/lib/python3.4/lib-dynload',
 '/home/me/.local/lib/python3.4/site-packages',
 '/usr/local/lib/python3.4/dist-packages',
 '/usr/lib/python3/dist-packages']
0

Tương tự, chúng tôi có thể trích xuất thông tin hữu ích bằng cách sử dụng BeautifulSoup4.

Bây giờ hãy để chúng tôi hiểu thêm về món súp súp trên ví dụ trên.