Hướng dẫn how do you store data in a new dataframe in python? - làm thế nào để bạn lưu trữ dữ liệu trong một khung dữ liệu mới trong python?

Trong hướng dẫn ngắn này, bạn sẽ thấy hai phương pháp khác nhau để tạo gấu trúc DataFrame:

  • Bằng cách nhập các giá trị vào chính Python để tạo DataFrame
  • Bằng cách nhập các giá trị từ một tệp (chẳng hạn như tệp CSV) và sau đó tạo khung dữ liệu trong python dựa trên các giá trị được nhập

Phương pháp 1: Gõ các giá trị trong Python để tạo GANDAS DATAFRAME

Để tạo gấu trúc DataFrame trong Python, bạn có thể làm theo mẫu chung này:

import pandas as pd

data = {'first_column':  ['first_value', 'second_value', ...],
        'second_column': ['first_value', 'second_value', ...],
         ....
        }

df = pd.DataFrame(data)

print(df)

Lưu ý rằng bạn không cần sử dụng báo giá xung quanh các giá trị số (trừ khi bạn muốn nắm bắt các giá trị đó dưới dạng chuỗi).

Bây giờ, hãy để xem cách áp dụng mẫu trên bằng một ví dụ đơn giản.

Để bắt đầu, hãy để nói rằng bạn có dữ liệu sau về sản phẩm và bạn muốn thu thập dữ liệu đó trong Python bằng cách sử dụng Pandas DataFrame:

product_name giá bán
máy tính xách tay1200
Máy in150
máy tính bảng300
bàn450
cái ghế200

Sau đó, bạn có thể sử dụng mã bên dưới để tạo DataFrame cho ví dụ của chúng tôi:

import pandas as pd

data = {'product_name': ['laptop', 'printer', 'tablet', 'desk', 'chair'],
        'price': [1200, 150, 300, 450, 200]
        }

df = pd.DataFrame(data)

print(df)

Chạy mã trong Python và bạn sẽ nhận được DataFrame sau:

  product_name  price
0       laptop   1200
1      printer    150
2       tablet    300
3         desk    450
4        chair    200

Bạn có thể nhận thấy rằng mỗi hàng được biểu thị bằng một số (còn được gọi là chỉ mục) bắt đầu từ 0. Thay vào đó, bạn có thể gán một giá trị/tên khác để biểu thị mỗi hàng.

Ví dụ: trong mã bên dưới, index = [‘sản phẩm_1,‘ sản phẩm_2, ‘sản phẩm_3,‘ sản phẩm_4, ‘sản phẩm_5,] đã được thêm vào:index=[‘product_1’, ‘product_2’, ‘product_3’, ‘product_4’, ‘product_5’] was added:

import pandas as pd

data = {'product_name': ['laptop', 'printer', 'tablet', 'desk', 'chair'],
        'price': [1200, 150, 300, 450, 200]
        }

df = pd.DataFrame(data, index=['product_1', 'product_2', 'product_3', 'product_4', 'product_5'])

print(df)

Bây giờ bạn sẽ thấy chỉ mục mới được chỉ định (như được tô sáng màu vàng):

          product_name  price
product_1       laptop   1200
product_2      printer    150
product_3       tablet    300
product_4         desk    450
product_5        chair    200

Bây giờ, hãy xem xét phương thức nhập thứ hai để nhập các giá trị vào Python để tạo ra DataFrame.

Phương pháp 2: Nhập các giá trị từ tệp CSV để tạo gấu trúc DataFrame

Bạn có thể sử dụng mẫu sau để nhập tệp CSV vào Python để tạo DataFrame của bạn:

import pandas as pd

data = pd.read_csv(r'Path where the CSV file is stored\File name.csv')
df = pd.DataFrame(data)

print(df)

Hãy nói rằng bạn có dữ liệu sau được lưu trữ trong tệp CSV (trong đó tên tệp CSV là ‘Sản phẩm):

product_name giá bán
máy tính xách tay1200
Máy in150
máy tính bảng300
bàn450
cái ghế200

Sau đó, bạn có thể sử dụng mã bên dưới để tạo DataFrame cho ví dụ của chúng tôi:

Chạy mã trong Python và bạn sẽ nhận được DataFrame sau:

Bạn có thể nhận thấy rằng mỗi hàng được biểu thị bằng một số (còn được gọi là chỉ mục) bắt đầu từ 0. Thay vào đó, bạn có thể gán một giá trị/tên khác để biểu thị mỗi hàng.‘C:\Users\Ron\Desktop\products.csv’

Ví dụ: trong mã bên dưới, index = [‘sản phẩm_1,‘ sản phẩm_2, ‘sản phẩm_3,‘ sản phẩm_4, ‘sản phẩm_5,] đã được thêm vào:

import pandas as pd

data = pd.read_csv(r'C:\Users\Ron\Desktop\products.csv')
df = pd.DataFrame(data)

print(df)

Bây giờ bạn sẽ thấy chỉ mục mới được chỉ định (như được tô sáng màu vàng):

  product_name  price
0       laptop   1200
1      printer    150
2       tablet    300
3         desk    450
4        chair    200

Bây giờ, hãy xem xét phương thức nhập thứ hai để nhập các giá trị vào Python để tạo ra DataFrame.

Phương pháp 2: Nhập các giá trị từ tệp CSV để tạo gấu trúc DataFrame

Bạn có thể sử dụng mẫu sau để nhập tệp CSV vào Python để tạo DataFrame của bạn:

Hãy nói rằng bạn có dữ liệu sau được lưu trữ trong tệp CSV (trong đó tên tệp CSV là ‘Sản phẩm):

Trong mã Python bên dưới, bạn sẽ cần thay đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp CSV trên máy tính của bạn.

Ví dụ, hãy để giả sử rằng tệp CSV được lưu trữ theo đường dẫn sau:

max_price = df['price'].max()

& nbsp; ‘C: \ users \ ron \ Desktop \ Products.csv

import pandas as pd

data = {'product_name': ['laptop', 'printer', 'tablet', 'desk', 'chair'],
        'price': [1200, 150, 300, 450, 200]
        }

df = pd.DataFrame(data)

max_price = df['price'].max()
print(max_price)

Đây là mã Python đầy đủ cho ví dụ của chúng tôi:

Như trước đây, bạn sẽ nhận được cùng một DataFrame trong Python:

Bạn cũng có thể tạo cùng một DataFrame bằng cách nhập tệp Excel vào Python bằng Pandas.

Dữ liệu được lưu trữ trong DataFrame như thế nào?

DataFrame là cấu trúc dữ liệu 2 chiều có thể lưu trữ dữ liệu của các loại khác nhau (bao gồm ký tự, số nguyên, giá trị điểm nổi, dữ liệu phân loại và nhiều hơn nữa) trong các cột.Nó tương tự như bảng tính, bảng SQL hoặc dữ liệu.Khung trong R. Bảng có 3 cột, mỗi cột với nhãn cột.in columns. It is similar to a spreadsheet, a SQL table or the data. frame in R. The table has 3 columns, each of them with a column label.

Làm thế nào để Python lưu trữ dữ liệu trong cơ sở dữ liệu?

Chèn các khung dữ liệu gấu trúc vào cơ sở dữ liệu bằng cách sử dụng chèn..
Bước 1: Tạo DataFrame bằng cách sử dụng từ điển.....
Bước 2: Tạo một bảng trong cơ sở dữ liệu MySQL của chúng tôi.....
Bước 3: Tạo kết nối với cơ sở dữ liệu.....
Bước 4: Tạo một danh sách cột và chèn hàng.....
Bước 5: Truy vấn cơ sở dữ liệu để kiểm tra công việc của chúng tôi ..