ExcelからPandasデータフレームへの簡単な変換方法


  1. pandasのread_excel関数を使用する方法:
import pandas as pd
# Excelファイルの読み込み
df = pd.read_excel('ファイル名.xlsx', sheet_name='シート名', header=0)
# 必要なデータの抽出
subset_df = df.loc[start_row:end_row, start_col:end_col]
  1. openpyxlライブラリを使用する方法:
import openpyxl
# Excelファイルの読み込み
wb = openpyxl.load_workbook('ファイル名.xlsx')
sheet = wb['シート名']
# 必要なデータの取得
data = []
for row in sheet.iter_rows(min_row=start_row, max_row=end_row, min_col=start_col, max_col=end_col):
    data.append([cell.value for cell in row])
# データフレームの作成
df = pd.DataFrame(data)
  1. xlrdライブラリを使用する方法:
import xlrd
# Excelファイルの読み込み
workbook = xlrd.open_workbook('ファイル名.xlsx')
sheet = workbook.sheet_by_name('シート名')
# 必要なデータの取得
data = []
for row in range(start_row, end_row+1):
    row_values = sheet.row_values(row, start_col, end_col+1)
    data.append(row_values)
# データフレームの作成
df = pd.DataFrame(data)

上記のコード例では、'ファイル名.xlsx'は変換したいExcelファイルの名前、'シート名'はデータを抽出したいシートの名前、そしてstart_row、end_row、start_col、end_colはデータの範囲を指定するための行と列のインデックスです。

これらの方法を使用することで、Excelファイルの一部をPandasデータフレームに簡単に変換することができます。