📊 データ処理

複数スプレッドシートの結合

複数のExcelまたはCSVファイルを1つの統一されたスプレッドシートに結合します

★★☆ 中級 10-15 min 2025年1月12日

概要

データを扱う際、異なるソースや期間からの複数のスプレッドシートファイルを結合する必要がよくあります。Claudeはこれらのファイルを自動的に結合し、ヘッダーの違いやデータの配置の問題を処理して、統一された集計スプレッドシートを生成できます。

活用シーン

  • 月次売上データシートの結合
  • 複数部門からのデータ提出の統合
  • 異なるソースからのアンケート結果の統合
  • 分割された大規模データセットの結合

手順

ステップ1: ファイルの一貫性を確認

まず、結合するファイルの構造が一致しているか分析します。

~/data/sales フォルダ内のすべてのExcelファイルを確認してください:
- すべてのファイル名とサイズを一覧表示
- ファイル間で列名が一致しているか確認
- 各ファイルの行数をカウント
- データ型の違いを特定
- 直接結合可能かどうかを報告

ステップ2: シンプルな結合

構造が同一のファイルを結合します。

~/data/sales フォルダ内のすべての.xlsxファイルを結合してください:
- すべてのファイルは同じ列構造を持っています
- 最初のファイルのヘッダーを保持し、他のファイルのヘッダー行はスキップ
- ~/data/sales_merged.xlsx に出力
- 各行がどのファイルから来たかを示す「ソースファイル」列を追加

ステップ3: 列の違いを処理

列名がわずかに異なるファイルを結合します。

ファイルの列名がわずかに異なります。インテリジェントに結合してください:
- 同じ意味だが異なる名前の列を特定(例:「名前」と「フルネーム」)
- 欠落している列にはnull値を埋める
- 追加の列も出力に含める
- 各列がどのように処理されたかを示す列マッピングレポートを生成

ステップ4: 条件付き結合

特定の条件を満たすデータのみを結合します。

~/data/reports 内のすべてのCSVファイルを結合しますが:
- 「ステータス」列が「完了」の行のみを含める
- 空の行と重複行を除外
- 「日付」列でソート
- ~/data/completed_reports.csv として出力

ステップ5: サマリー情報の追加

結合ファイルに統計情報を追加します。

データ結合後、新しいワークシートにサマリーを追加してください:
- 各ソースファイルが提供した行数
- カテゴリ別の合計
- 日付範囲
- 主要な数値フィールドの合計と平均
「生データ」と「サマリー」ワークシートを含むExcelファイルを作成

警告: 多くのファイルを結合すると時間がかかり、メモリを消費する可能性があります。すべてのファイルを処理する前に、まず小規模でテストして結合ロジックが正しいことを確認することをお勧めします。

ヒント: 定期的にファイルを結合する必要がある場合、ダブルクリックするだけで自動的に実行されるスクリプトをClaudeに作成してもらうことができます。

よくある質問

Q: 結合後のExcelファイルが開けない場合は? A: ファイルが大きすぎてExcelの制限(約100万行)を超えている可能性があります。バッチで結合するか、CSV形式で出力することを検討してください。

Q: 日付形式が一致しない場合の処理方法は? A: 一般的な日付形式(2024-01-01、01/01/2024など)を認識し、結合前に標準形式に変換するようClaudeに指示してください。

Q: 異なる形式のファイルを結合できますか? A: はい。Claudeは.xlsx、.xls、.csvなどの異なる形式を同時に処理し、指定された出力形式に結合できます。