Tôi lặp vào các tệp CSV trong một thư mục và đọc chúng với gấu trúc. Đối với mỗi tệp CSV, tôi có một danh mục và một thị trường. Sau đó, tôi cần lấy ID của danh mục và ID của thị trường từ cơ sở dữ liệu sẽ có giá trị cho tệp CSV này.
FinalDF là một khung dữ liệu chứa tất cả các sản phẩm cho tất cả các tệp CSV và tôi cần nối nó bằng dữ liệu Fron CSV hiện tại.
Danh sách các sản phẩm của CSV hiện tại được lấy lại bằng cách sử dụng:
df['PRODUCT']
Tôi cần nối chúng vào FinalDF và tôi đã sử dụng:
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
Điều này có vẻ hoạt động tốt, và bây giờ tôi phải chèn catid và marketid vào các cột tương ứng của FinalDF. Bởi vì Catid và MarketID được chấp nhận tệp CSV hiện tại, tôi chỉ cần thêm chúng nhiều thời gian như có các hàng trong DFAFrame, đây là điều tôi đang cố gắng thực hiện trong mã bên dưới.
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
Như bạn có thể thấy, tôi chỉ có các giá trị NAN thay vì các giá trị thực tế. đầu ra dự kiến:
PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
FinalDF chứa một số CSV sẽ trông giống như:
PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
5 SDD 2114 13
6 ERT 2114 13
7 GHJ 2114 13
8 MOD 2114 13
9 GTR 2114 13
10 WLY 2114 13
11 WLO 2115 13
12 KOP 2115 13
Bất kỳ ý tưởng?
Cảm ơn
7 PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
5 SDD 2114 13
6 ERT 2114 13
7 GHJ 2114 13
8 MOD 2114 13
9 GTR 2114 13
10 WLY 2114 13
11 WLO 2115 13
12 KOP 2115 13
8 PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
5 SDD 2114 13
6 ERT 2114 13
7 GHJ 2114 13
8 MOD 2114 13
9 GTR 2114 13
10 WLY 2114 13
11 WLO 2115 13
12 KOP 2115 13
9 PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
5 SDD 2114 13
6 ERT 2114 13
7 GHJ 2114 13
8 MOD 2114 13
9 GTR 2114 13
10 WLY 2114 13
11 WLO 2115 13
12 KOP 2115 13
DataFrameName.insert[loc, column, value, allow_duplicates = False]
0DataFrameName.insert[loc, column, value, allow_duplicates = False]
1=
____9 DataFrameName.insert[loc, column, value, allow_duplicates = False]
4DataFrameName.insert[loc, column, value, allow_duplicates = False]
5
Các
Các
For example, even column location can’t be decided and hence the inserted column is always inserted in the last position.
Syntax:
PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
5 SDD 2114 13
6 ERT 2114 13
7 GHJ 2114 13
8 MOD 2114 13
9 GTR 2114 13
10 WLY 2114 13
11 WLO 2115 13
12 KOP 2115 13
7data
7DataFrameName.insert[loc, column, value, allow_duplicates = False]5
Parameters:
DataFrameName.insert[loc, column, value, allow_duplicates = False]6DataFrameName.insert[loc, column, value, allow_duplicates = False]7=
9PRODUCT CAT_ID MARKET_ID 0 ABC 2113 13 1 ABB 2113 13 2 ABE 2113 13 3 DCB 2113 13 4 EFT 2113 13 5 SDD 2114 13 6 ERT 2114 13 7 GHJ 2114 13 8 MOD 2114 13 9 GTR 2114 13 10 WLY 2114 13 11 WLO 2115 13 12 KOP 2115 13
DataFrameName.insert[loc, column, value, allow_duplicates = False]0=
4loc is an integer which is the location of column where we want to insert new column. This will shift the existing column at that position to the right.
column: column is a string which is name of column to be inserted.
value: value is simply the value to be inserted. It can be int, string, float or anything or even series / List of values. Providing only one value will set the same value for all rows.
allow_duplicates : allow_duplicates is a boolean value which checks if column with same name already exists or not.
Tìm liên kết đến tệp CSV được sử dụng từ đây. & NBSP;
Chèn một cột có giá trị tĩnh:
Python3
import
pandas as pd
data
=
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
0finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
1finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
2finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
3Output:
Sau khi chèn cột: & nbsp; & nbsp;
Python3
import
pandas as pd
data
=
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
0finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
1finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
2finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
3Sau khi chèn cột: & nbsp; & nbsp;
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
3finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
2finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
3finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
4finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
5finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
4finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
7__12
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
Vượt qua chuỗi với giá trị khác nhau cho mỗi hàng:
Trong ví dụ này, một loạt được tạo ra và một số giá trị được chuyển đến loạt thông qua một vòng lặp. Sau đó, loạt phim được truyền trong chức năng chèn gấu trúc vào chuỗi nối trong khung dữ liệu với các giá trị được truyền. & NBSP;
import
pandas as pd
data
=
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
0finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
1finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
2data
=
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
0finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
1finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
2Sau khi chèn cột: & nbsp; & nbsp;
finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
2finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
3finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
4finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
5finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
4finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
7__12DataFrameName.insert[loc, column, value, allow_duplicates = False]6
DataFrameName.insert[loc, column, value, allow_duplicates = False]7
=
DataFrameName.insert[loc, column, value, allow_duplicates = False]9
Vượt qua chuỗi với giá trị khác nhau cho mỗi hàng:
DataFrameName.insert[loc, column, value, allow_duplicates = False]6
DataFrameName.insert[loc, column, value, allow_duplicates = False]7
=
pandas as pd
2Trong ví dụ này, một loạt được tạo ra và một số giá trị được chuyển đến loạt thông qua một vòng lặp. Sau đó, loạt phim được truyền trong chức năng chèn gấu trúc vào chuỗi nối trong khung dữ liệu với các giá trị được truyền. & NBSP;
DataFrameName.insert[loc, column, value, allow_duplicates = False]6
DataFrameName.insert[loc, column, value, allow_duplicates = False]7
=
data
5Python
PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
2=
PRODUCT CAT_ID MARKET_ID
0 ABC 2113 13
1 ABB 2113 13
2 ABE 2113 13
3 DCB 2113 13
4 EFT 2113 13
4finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
2finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
3finalDf = pd.DataFrame[columns=['PRODUCT', 'CAT_ID', 'MARKET_ID']]
finalDf['PRODUCT'] = finalDf.PRODUCT.astype['category']
df = pd.read_csv[filename, header=None,
names=['PRODUCT', 'URL_PRODUCT', 'RANK', 'URL_IMAGE', 'STARS', 'PRICE', 'NAME', 'SNAPDATE',
'CATEGORY', 'MARKETPLACE', 'PARENTCAT', 'LISTTYPE', 'VERSION', 'LEVEL'], sep='\t']
finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
# Here I have a single value to add n times, n corresponding to the number of rows in the dataframe df
catid = 2113
marketid = 13
catids = pd.Series[[catid]*len[df.index]]
marketids = pd.Series[[marketid]*len[df.index]]
finalDf['CAT_ID'] = finalDf['CAT_ID'].append[catids, ignore_index=True]
finalDf['MARKET_ID'] = finalDf['MARKET_ID'].append[marketids, ignore_index=True]
print finalDf.head[]
PRODUCT CAT_ID MARKET_ID
0 ABC NaN NaN
1 ABB NaN NaN
2 ABE NaN NaN
3 DCB NaN NaN
4 EFT NaN NaN
4=
8=
9finalDf['PRODUCT'] = finalDf['PRODUCT'].append[df['PRODUCT'],ignore_index=True]
3Output: