Pyserini Reproductions: MS MARCO V2 Passage

The two-click^* reproduction matrix below provides commands for reproducing experimental results reported in the following paper. Numbered rows correspond to tables in the paper; additional conditions are provided for comparison purposes.

Instructions for programmatic execution are shown at the bottom of this page (scroll down).

		TREC 2021			TREC 2022			TREC 2023			dev		dev2
		AP	nDCG@10	R@1K	AP	nDCG@10	R@1K	AP	nDCG@10	R@1K	RR@100	R@1K	RR@100	R@1K
(1a)	BM25 original passage	0.1357	0.4458	0.6149	0.0325	0.2692	0.3321	0.0793	0.2627	0.4346	0.0719	0.5733	0.0802	0.5839
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-default.dl21.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-default.dl22.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-default.dl23.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-default.dev.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-default.dev2.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-default.dev2.txt`
(1b)	BM25 augmented passage	0.0977	0.3977	0.5835	0.0346	0.2742	0.3666	0.0751	0.2061	0.4514	0.0872	0.6925	0.0917	0.6933
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-augmented-default.dl21.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-augmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-augmented-default.dl22.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-augmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-augmented-default.dl23.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-augmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-augmented-default.dev.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-augmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-augmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-augmented-default.dev2.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-augmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-augmented-default.dev2.txt`
(1c)	BM25+RM3 original passage	0.1666	0.4455	0.6616	0.0310	0.2686	0.3559	0.0806	0.2602	0.4748	0.0630	0.5947	0.0659	0.6062
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-rm3-default.dl21.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-rm3-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-rm3-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-rm3-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-rm3-default.dl22.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-rm3-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-rm3-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-rm3-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-rm3-default.dl23.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-rm3-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-rm3-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-rm3-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-rm3-default.dev.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-rm3-default.dev2.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-default.dev2.txt`
(1d)	BM25+RM3 augmented passage	0.1050	0.3869	0.6298	0.0318	0.2571	0.3441	0.0646	0.1798	0.4583	0.0667	0.6857	0.0700	0.6826
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-rm3-augmented-default.dl21.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-rm3-augmented-default.dl22.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-rm3-augmented-default.dl23.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-rm3-augmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-rm3-augmented-default.dev.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-augmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-augmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-rm3-augmented-default.dev2.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-augmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-augmented-default.dev2.txt`

(2a)	BM25 w/ doc2query-T5 original passage	0.1874	0.4816	0.7078	0.0748	0.3599	0.4632	0.1085	0.3156	0.5608	0.1072	0.7083	0.1123	0.7151
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5 \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-d2q-t5-default.dl21.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5 \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-d2q-t5-default.dl22.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5 \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-d2q-t5-default.dl23.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-d2q-t5-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5 \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-d2q-t5-default.dev.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-d2q-t5-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-d2q-t5-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5 \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-d2q-t5-default.dev2.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-d2q-t5-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-d2q-t5-default.dev2.txt`
(2b)	BM25 w/ doc2query-T5 augmented passage	0.1649	0.4702	0.6962	0.0735	0.3609	0.4739	0.1078	0.2926	0.5689	0.1172	0.7647	0.1170	0.7659
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5 \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl21.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5 \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl22.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5 \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl23.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5 \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dev.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5 \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dev2.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-d2q-t5-augmented-default.dev2.txt`
(2c)	BM25+RM3 w/ doc2query-T5 original passage	0.2285	0.5098	0.7537	0.0872	0.3721	0.4964	0.1135	0.3132	0.5978	0.0947	0.7181	0.0984	0.7222
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5-docvectors \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl21.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5-docvectors \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl22.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5-docvectors \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl23.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5-docvectors \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dev.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.d2q-t5-docvectors \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dev2.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-d2q-t5-default.dev2.txt`
(2d)	BM25+RM3 w/ doc2query-T5 augmented passage	0.1930	0.4812	0.7672	0.0821	0.3749	0.4914	0.1059	0.2719	0.5623	0.0883	0.7607	0.0904	0.7649
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5-docvectors \ --topics dl21 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl21.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5-docvectors \ --topics dl22 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl22.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5-docvectors \ --topics dl23 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl23.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5-docvectors \ --topics msmarco-v2-passage-dev \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dev.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage-augmented.d2q-t5-docvectors \ --topics msmarco-v2-passage-dev2 \ --output run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dev2.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.bm25-rm3-d2q-t5-augmented-default.dev2.txt`

(3a)	uniCOIL (noexp): cached queries	0.2193	0.5756	0.6897	0.0754	0.4077	0.4423	0.1112	0.3262	0.5070	0.1342	0.7010	0.1385	0.7114
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics dl21-unicoil-noexp \ --output run.msmarco-v2-passage.unicoil-noexp.dl21.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.unicoil-noexp.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.unicoil-noexp.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.unicoil-noexp.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics dl22-unicoil-noexp \ --output run.msmarco-v2-passage.unicoil-noexp.dl22.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.unicoil-noexp.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.unicoil-noexp.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.unicoil-noexp.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics dl23-unicoil-noexp \ --output run.msmarco-v2-passage.unicoil-noexp.dl23.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.unicoil-noexp.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.unicoil-noexp.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.unicoil-noexp.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics msmarco-v2-passage-dev-unicoil-noexp \ --output run.msmarco-v2-passage.unicoil-noexp.dev.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil-noexp.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil-noexp.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics msmarco-v2-passage-dev2-unicoil-noexp \ --output run.msmarco-v2-passage.unicoil-noexp.dev2.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil-noexp.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil-noexp.dev2.txt`
(3b)	uniCOIL (w/ doc2query-T5): cached queries	0.2538	0.6159	0.7551	0.1050	0.4614	0.5253	0.1437	0.3855	0.5541	0.1499	0.7616	0.1577	0.7671
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics dl21-unicoil \ --output run.msmarco-v2-passage.unicoil.dl21.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.unicoil.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.unicoil.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.unicoil.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics dl22-unicoil \ --output run.msmarco-v2-passage.unicoil.dl22.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.unicoil.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.unicoil.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.unicoil.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics dl23-unicoil \ --output run.msmarco-v2-passage.unicoil.dl23.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.unicoil.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.unicoil.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.unicoil.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics msmarco-v2-passage-dev-unicoil \ --output run.msmarco-v2-passage.unicoil.dev.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics msmarco-v2-passage-dev2-unicoil \ --output run.msmarco-v2-passage.unicoil.dev2.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil.dev2.txt`

	uniCOIL (noexp): PyTorch	0.2193	0.5756	0.6897	0.0754	0.4077	0.4423	0.1112	0.3262	0.5070	0.1342	0.7010	0.1385	0.7114
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics dl21 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-noexp-otf.dl21.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics dl22 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-noexp-otf.dl22.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics dl23 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-noexp-otf.dl23.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.unicoil-noexp-otf.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics msmarco-v2-passage-dev \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-noexp-otf.dev.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil-noexp-otf.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil-noexp-otf.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-noexp-0shot \ --topics msmarco-v2-passage-dev2 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-noexp-otf.dev2.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil-noexp-otf.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil-noexp-otf.dev2.txt`
	uniCOIL (w/ doc2query-T5): PyTorch	0.2538	0.6159	0.7551	0.1050	0.4614	0.5253	0.1437	0.3855	0.5541	0.1499	0.7616	0.1577	0.7671
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics dl21 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-otf.dl21.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.unicoil-otf.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.unicoil-otf.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.unicoil-otf.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics dl22 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-otf.dl22.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.unicoil-otf.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.unicoil-otf.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.unicoil-otf.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics dl23 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-otf.dl23.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.unicoil-otf.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.unicoil-otf.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.unicoil-otf.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics msmarco-v2-passage-dev \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-otf.dev.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil-otf.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.unicoil-otf.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.unicoil-0shot \ --topics msmarco-v2-passage-dev2 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-passage.unicoil-otf.dev2.txt \ --hits 1000 --impact` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil-otf.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.unicoil-otf.dev2.txt`
	SLIM++ (`norefine`, `tau`=0.5, `min_idf`=1)	0.2820	0.6337	0.8389	0.1616	0.5017	0.6159	0.1772	0.4746	0.6412	0.1915	0.8710	0.1901	0.8681
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.slimr-pp \ --topics dl21 \ --encoder castorini/slimr-pp-msmarco-passage \ --output run.msmarco-v2-passage.slimr-pp.dl21.txt \ --hits 1000 --impact --min-idf 1` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl21-passage run.msmarco-v2-passage.slimr-pp.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-passage run.msmarco-v2-passage.slimr-pp.dl21.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl21-passage run.msmarco-v2-passage.slimr-pp.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.slimr-pp \ --topics dl22 \ --encoder castorini/slimr-pp-msmarco-passage \ --output run.msmarco-v2-passage.slimr-pp.dl22.txt \ --hits 1000 --impact --min-idf 1` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl22-passage run.msmarco-v2-passage.slimr-pp.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-passage run.msmarco-v2-passage.slimr-pp.dl22.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl22-passage run.msmarco-v2-passage.slimr-pp.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.slimr-pp \ --topics dl23 \ --encoder castorini/slimr-pp-msmarco-passage \ --output run.msmarco-v2-passage.slimr-pp.dl23.txt \ --hits 1000 --impact --min-idf 1` Evaluation commands: `python -m pyserini.eval.trec_eval -c -l 2 -M 100 -m map dl23-passage run.msmarco-v2-passage.slimr-pp.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-passage run.msmarco-v2-passage.slimr-pp.dl23.txt python -m pyserini.eval.trec_eval -c -l 2 -m recall.1000 dl23-passage run.msmarco-v2-passage.slimr-pp.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.slimr-pp \ --topics msmarco-v2-passage-dev \ --encoder castorini/slimr-pp-msmarco-passage \ --output run.msmarco-v2-passage.slimr-pp.dev.txt \ --hits 1000 --impact --min-idf 1` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev run.msmarco-v2-passage.slimr-pp.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev run.msmarco-v2-passage.slimr-pp.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-passage.slimr-pp \ --topics msmarco-v2-passage-dev2 \ --encoder castorini/slimr-pp-msmarco-passage \ --output run.msmarco-v2-passage.slimr-pp.dev2.txt \ --hits 1000 --impact --min-idf 1` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-passage-dev2 run.msmarco-v2-passage.slimr-pp.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-passage-dev2 run.msmarco-v2-passage.slimr-pp.dev2.txt`

MS MARCO V2 Passage Regressions

Programmatic Execution