Trong tập trước, chúng tôi đã phân tích một tệp dữ liệu viêm thử nghiệm lâm sàng. Tuy nhiên, sau khi tìm thấy một số xu hướng đặc biệt và có khả năng đáng ngờ trong dữ liệu thử nghiệm, chúng tôi hỏi Tiến sĩ. Maverick nếu họ đã thực hiện bất kỳ thử nghiệm lâm sàng nào khác. Đáng ngạc nhiên là họ nói rằng họ có và cung cấp cho chúng tôi thêm 11 tệp CSV cho 11 thử nghiệm lâm sàng khác mà họ đã thực hiện kể từ thử nghiệm đầu tiên
Mục tiêu của chúng tôi bây giờ là xử lý tất cả dữ liệu về tình trạng viêm mà chúng tôi có, điều đó có nghĩa là chúng tôi vẫn còn 11 tệp nữa phải xử lý
Bước đầu tiên tự nhiên là thu thập tên của tất cả các tệp mà chúng tôi phải xử lý. Trong Python, danh sách là một cách để lưu trữ nhiều giá trị cùng nhau. Trong tập này, chúng ta sẽ tìm hiểu cách lưu trữ nhiều giá trị trong một danh sách cũng như cách làm việc với danh sách
danh sách Python
Không giống như mảng NumPy, danh sách được tích hợp sẵn trong ngôn ngữ nên chúng tôi không phải tải thư viện để sử dụng chúng. Chúng tôi tạo một danh sách bằng cách đặt các giá trị bên trong dấu ngoặc vuông và phân tách các giá trị bằng dấu phẩy
odds = [1, 3, 5, 7]
print['odds are:', odds]
odds are: [1, 3, 5, 7]
Chúng ta có thể truy cập các phần tử của danh sách bằng cách sử dụng các chỉ số – vị trí được đánh số của các phần tử trong danh sách. Các vị trí này được đánh số bắt đầu từ 0 nên phần tử đầu tiên có chỉ số là 0
print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
first element: 1
last element: 7
"-1" element: 7
Có, chúng ta có thể sử dụng số âm làm chỉ số trong Python. Khi chúng tôi làm như vậy, chỉ số
names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
0 cung cấp cho chúng tôi phần tử cuối cùng trong danh sách, names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
1 thứ hai đến cuối cùng, v.v. Vì điều này, names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
2 và names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
3 trỏ đến cùng một yếu tố ở đâyCó một sự khác biệt quan trọng giữa danh sách và chuỗi. chúng ta có thể thay đổi các giá trị trong một danh sách, nhưng chúng ta không thể thay đổi các ký tự riêng lẻ trong một chuỗi. Ví dụ
________số 8
names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
hoạt động, nhưng
odds are: [1, 3, 5, 7]
0odds are: [1, 3, 5, 7]
1không làm
Ch-Ch-Ch-Ch-Thay đổi
Dữ liệu có thể sửa đổi tại chỗ được gọi là có thể thay đổi, trong khi dữ liệu không thể sửa đổi được gọi là bất biến. Chuỗi và số là bất biến. Điều này không có nghĩa là các biến có giá trị chuỗi hoặc số là hằng số, mà khi muốn thay đổi giá trị của biến chuỗi hoặc số, chúng ta chỉ có thể thay thế giá trị cũ bằng một giá trị hoàn toàn mới.
Mặt khác, danh sách và mảng có thể thay đổi. chúng ta có thể sửa đổi chúng sau khi chúng được tạo. Chúng ta có thể thay đổi các phần tử riêng lẻ, thêm các phần tử mới hoặc sắp xếp lại toàn bộ danh sách. Đối với một số thao tác, chẳng hạn như sắp xếp, chúng ta có thể chọn sử dụng hàm sửa đổi dữ liệu tại chỗ hay hàm trả về bản sao đã sửa đổi và giữ nguyên bản gốc
Hãy cẩn thận khi sửa đổi dữ liệu tại chỗ. Nếu hai biến tham chiếu đến cùng một danh sách và bạn sửa đổi giá trị danh sách, nó sẽ thay đổi cho cả hai biến
2odds are: [1, 3, 5, 7]
3odds are: [1, 3, 5, 7]
Nếu bạn muốn các biến có giá trị có thể thay đổi độc lập với nhau, bạn phải tạo một bản sao của giá trị khi gán nó
0odds are: [1, 3, 5, 7]
1odds are: [1, 3, 5, 7]
Vì những cạm bẫy như thế này, mã sửa đổi dữ liệu tại chỗ có thể khó hiểu hơn. Tuy nhiên, việc sửa đổi cấu trúc dữ liệu lớn tại chỗ thường hiệu quả hơn nhiều so với việc tạo một bản sao đã sửa đổi cho mọi thay đổi nhỏ. Bạn nên xem xét cả hai khía cạnh này khi viết mã của mình
Danh sách lồng nhau
Vì một danh sách có thể chứa bất kỳ biến Python nào, nên nó thậm chí có thể chứa các danh sách khác
Ví dụ: chúng ta có thể trưng bày các sản phẩm trên kệ của một cửa hàng tạp hóa nhỏ
2odds are: [1, 3, 5, 7]
Dưới đây là một ví dụ trực quan về cách lập chỉ mục danh sách các danh sách
4 hoạt độngnames is originally: ['Curie', 'Darwing', 'Turing'] final value of names: ['Curie', 'Darwin', 'Turing']
Sử dụng danh sách đã khai báo trước đó
4, đây sẽ là kết quả của các hoạt động chỉ mục được hiển thị trong hình ảnhnames is originally: ['Curie', 'Darwing', 'Turing'] final value of names: ['Curie', 'Darwin', 'Turing']
3odds are: [1, 3, 5, 7]
4odds are: [1, 3, 5, 7]
5odds are: [1, 3, 5, 7]
6odds are: [1, 3, 5, 7]
7odds are: [1, 3, 5, 7]
8odds are: [1, 3, 5, 7]
Cảm ơn Hadley Wickham cho hình ảnh trên
Danh sách không đồng nhất
Danh sách trong Python có thể chứa các phần tử thuộc các loại khác nhau. Thí dụ
9odds are: [1, 3, 5, 7]
Có nhiều cách để thay đổi nội dung của danh sách ngoài việc gán giá trị mới cho các phần tử riêng lẻ
print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
0print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
1print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
2print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
3print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
4print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
5Trong khi sửa đổi tại chỗ, thật hữu ích khi nhớ rằng Python xử lý các danh sách theo cách hơi phản trực giác
Như chúng ta đã thấy trước đó, khi chúng ta sửa đổi mục danh sách
names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
6 tại chỗ, nếu chúng ta tạo một danh sách, [cố gắng] sao chép nó và sau đó sửa đổi danh sách này, chúng ta có thể gây ra đủ loại rắc rối. Điều này cũng áp dụng để sửa đổi danh sách bằng các chức năng trênprint['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
6print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
7Điều này là do Python lưu trữ một danh sách trong bộ nhớ và sau đó có thể sử dụng nhiều tên để chỉ cùng một danh sách. Nếu tất cả những gì chúng ta muốn làm là sao chép một danh sách [đơn giản], chúng ta có thể sử dụng lại hàm
names is originally: ['Curie', 'Darwing', 'Turing']
final value of names: ['Curie', 'Darwin', 'Turing']
7, vì vậy chúng ta không sửa đổi danh sách mà chúng ta không cố ýprint['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
8print['first element:', odds[0]]
print['last element:', odds[3]]
print['"-1" element:', odds[-1]]
9Có thể truy cập tập hợp con của danh sách và chuỗi bằng cách chỉ định phạm vi giá trị trong ngoặc, tương tự như cách chúng tôi truy cập phạm vi vị trí trong mảng NumPy. Điều này thường được gọi là "cắt" danh sách/chuỗi
first element: 1
last element: 7
"-1" element: 7
0first element: 1
last element: 7
"-1" element: 7
1Cắt từ cuối
Sử dụng cắt để chỉ truy cập bốn ký tự cuối cùng của một chuỗi hoặc các mục của danh sách
2first element: 1 last element: 7 "-1" element: 7
3first element: 1 last element: 7 "-1" element: 7
Liệu giải pháp của bạn có hoạt động bất kể bạn có biết trước độ dài của chuỗi hoặc danh sách [e. g. nếu bạn muốn áp dụng giải pháp cho một tập hợp các danh sách có độ dài khác nhau]?
Dấu. Hãy nhớ rằng các chỉ số có thể âm cũng như dương
Dung dịch
Sử dụng các chỉ số phủ định để đếm các phần tử từ cuối vùng chứa [chẳng hạn như danh sách hoặc chuỗi]
4first element: 1 last element: 7 "-1" element: 7
Lát không liên tục
Cho đến nay, chúng ta đã biết cách sử dụng phép cắt để lấy các khối đơn lẻ của các mục liên tiếp từ một chuỗi. Nhưng nếu chúng ta muốn lấy một tập hợp con các mục không nằm cạnh nhau trong chuỗi thì sao?
Bạn có thể đạt được điều này bằng cách cung cấp đối số thứ ba cho phạm vi trong ngoặc, được gọi là kích thước bước. Ví dụ dưới đây cho thấy cách bạn có thể lấy mọi mục nhập thứ ba trong danh sách
5first element: 1 last element: 7 "-1" element: 7
6first element: 1 last element: 7 "-1" element: 7
Lưu ý rằng lát cắt được thực hiện bắt đầu bằng mục đầu tiên trong phạm vi, tiếp theo là các mục được thực hiện ở các khoảng cách đều nhau [các bước] sau đó. Nếu bạn muốn bắt đầu tập hợp con với mục nhập thứ ba, bạn cần chỉ định đó là điểm bắt đầu của phạm vi được cắt
7first element: 1 last element: 7 "-1" element: 7
8first element: 1 last element: 7 "-1" element: 7
Sử dụng đối số kích thước bước để tạo một chuỗi mới chỉ chứa mọi ký tự khác trong chuỗi “Trong khu vườn của bạch tuộc trong bóng râm”. Bắt đầu với việc tạo một biến để giữ chuỗi
9first element: 1 last element: 7 "-1" element: 7
Phần nào của
8 sẽ tạo ra đầu ra sau [i. e. , ký tự đầu tiên, ký tự thứ ba và mọi ký tự khác cho đến hết chuỗi]?names is originally: ['Curie', 'Darwing', 'Turing'] final value of names: ['Curie', 'Darwin', 'Turing']
0names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name print['names is originally:', names] names[1] = 'Darwin' # correct the name print['final value of names:', names]
Dung dịch
Để có được mọi ký tự khác, bạn cần cung cấp một lát có kích thước bước là 2
1names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name print['names is originally:', names] names[1] = 'Darwin' # correct the name print['final value of names:', names]
Bạn cũng có thể bỏ qua phần đầu và phần cuối của lát để lấy toàn bộ chuỗi và chỉ cung cấp đối số bước để đi từng phần tử thứ hai
2names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name print['names is originally:', names] names[1] = 'Darwin' # correct the name print['final value of names:', names]
Nếu bạn muốn lấy một lát từ phần đầu của dãy, bạn có thể bỏ qua chỉ số đầu tiên trong dãy
names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name
print['names is originally:', names]
names[1] = 'Darwin' # correct the name
print['final value of names:', names]
3names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name
print['names is originally:', names]
names[1] = 'Darwin' # correct the name
print['final value of names:', names]
4Và tương tự, bạn có thể bỏ chỉ số kết thúc trong dãy để đi một lát đến cuối dãy
names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name
print['names is originally:', names]
names[1] = 'Darwin' # correct the name
print['final value of names:', names]
5names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name
print['names is originally:', names]
names[1] = 'Darwin' # correct the name
print['final value of names:', names]
6quá tải
9 thường có nghĩa là phép cộng, nhưng khi được sử dụng trên các chuỗi hoặc danh sách, nó có nghĩa là “nối”. Cho rằng, bạn nghĩ toán tử nhânnames is originally: ['Curie', 'Darwing', 'Turing'] final value of names: ['Curie', 'Darwin', 'Turing']
00 làm gì trong danh sách?odds are: [1, 3, 5, 7]
7names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name print['names is originally:', names] names[1] = 'Darwin' # correct the name print['final value of names:', names]
01odds are: [1, 3, 5, 7]
02odds are: [1, 3, 5, 7]
03odds are: [1, 3, 5, 7]
04odds are: [1, 3, 5, 7]
Thuật ngữ kỹ thuật cho điều này là quá tải toán tử. một toán tử đơn lẻ, chẳng hạn như
9 hoặcnames is originally: ['Curie', 'Darwing', 'Turing'] final value of names: ['Curie', 'Darwin', 'Turing']
00, có thể thực hiện những việc khác nhau tùy thuộc vào những gì nó được áp dụng choodds are: [1, 3, 5, 7]
Dung dịch
Toán tử nhân
00 được sử dụng trên danh sách sao chép các phần tử của danh sách và nối chúng lại với nhauodds are: [1, 3, 5, 7]
8names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name print['names is originally:', names] names[1] = 'Darwin' # correct the name print['final value of names:', names]
Nó tương đương với
9names = ['Curie', 'Darwing', 'Turing'] # typo in Darwin's name print['names is originally:', names] names[1] = 'Darwin' # correct the name print['final value of names:', names]
Những điểm chính
08 tạo một danh sáchodds are: [1, 3, 5, 7]
Danh sách có thể chứa bất kỳ đối tượng Python nào, kể cả danh sách [i. e. , danh sách các danh sách]
Danh sách được lập chỉ mục và cắt bằng dấu ngoặc vuông [e. g. , danh sách[0] và danh sách[2. 9]], giống như chuỗi và mảng
Bạn có thể thay đổi giá trị của danh sách trong Python không?
Chúng ta có thể thay thế các giá trị bên trong danh sách bằng cách cắt . Đầu tiên, chúng tôi tìm chỉ mục của biến mà chúng tôi muốn thay thế và lưu trữ nó trong biến 'i'. Sau đó, chúng tôi thay thế mục đó bằng một giá trị mới bằng cách sử dụng danh sách cắt.Bạn có thể sử dụng += với danh sách Python không?
Các toán tử + và * có thể được sử dụng để nối danh sách và nhân danh sách. Các toán tử ghép += và *= có thể nối các danh sách, nhân các danh sách và chuyển danh tính mới vào danh sách ban đầu .Tôi có thể cập nhật phần tử của danh sách không?
Bạn có thể cập nhật một hoặc nhiều phần tử của danh sách bằng cách đưa lát cắt ở phía bên trái của toán tử gán và bạn có thể thêm vào các phần tử trong danh sách bằng phần nối thêm .