= ProcessDS = == データセットの管理 == * データセット名のリスト * データセットに対してジョブを投げる * ジョブのステータスの確認 * データセットに関するメタデータの取得(AMI) * AMIで取得したメタデータの読み込み * 出力データセット(_ANALYSYS)ファイルリストの生成 * 出力ファイルを実際に読んでイベント数を数える == 実行環境 == python3 -m venv venvで仮想環境を作ってyamlを入れる。 === AnalysisBase+Panda+Rucio === この環境でする作業は以下の通り。 * データセット名のリスト * データセットに対してジョブを投げる * ジョブのステータスの確認 * AMIで取得したメタデータの読み込み * 出力データセット(_ANALYSYS)ファイルリストの生成 * 出力ファイルを実際に読んでイベント数を数える {{{ setupATLAS lsetup panda lsetup emi lsetup rucio source ./venv/bin/activate cd dev/build source ./x86*/setup.sh gridproxy }}} {{{ processDS.py -i ds.txt -b ds_bk.yaml processDS.py -b ds_bk.yaml -s sub1.sh ./sub1.sh processDS.py -b ds_bk.yaml -u processDS.py -b ds_bk.yaml --dsInfoFile amiOutput.txt pds_hists.py -b ds_bk.yaml processDS.py -b ds_bk.yaml --sampleInfoFile sampleInfos.txt }}} === AMI === * データセットに関するメタデータの取得(AMI) {{{ setupATLAS lsetup pyami source ./venv/bin/activate gridproxy }}} {{{ pds_ami.sh ds.txt amiOutput.txt }}}