Pyserini Reproductions: MS MARCO V2 Document

The two-click^* reproduction matrix below provides commands for reproducing experimental results reported in the following paper. Numbered rows correspond to tables in the paper; additional conditions are provided for comparison purposes.

Instructions for programmatic execution are shown at the bottom of this page (scroll down).

		TREC 2021			TREC 2022			TREC 2023			dev		dev2
		AP	nDCG@10	R@1K	AP	nDCG@10	R@1K	AP	nDCG@10	R@1K	RR@100	R@1K	RR@100	R@1K
(1a)	BM25 doc	0.2126	0.5116	0.6739	0.0801	0.2993	0.4107	0.1046	0.2946	0.5262	0.1572	0.8054	0.1659	0.8029
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-doc-default.dl21.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-doc-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-doc-default.dl22.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-doc-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-doc-default.dl23.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-doc-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-doc-default.dev.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-doc-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-doc-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-doc-default.dev2.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-doc-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-doc-default.dev2.txt`
(1b)	BM25 doc segmented	0.2436	0.5776	0.6930	0.1036	0.3618	0.4664	0.1341	0.3405	0.5662	0.1896	0.8542	0.1930	0.8549
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-doc-segmented-default.dl21.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-doc-segmented-default.dl22.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-doc-segmented-default.dl23.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-doc-segmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-doc-segmented-default.dev.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-doc-segmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-doc-segmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-doc-segmented-default.dev2.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-doc-segmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-doc-segmented-default.dev2.txt`
(1c)	BM25+RM3 doc	0.2452	0.5304	0.7341	0.0798	0.2536	0.4217	0.1174	0.2462	0.5232	0.0974	0.7699	0.1033	0.7736
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-rm3-doc-default.dl21.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-rm3-doc-default.dl22.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-rm3-doc-default.dl23.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-rm3-doc-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-rm3-doc-default.dev.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-doc-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-doc-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-rm3-doc-default.dev2.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-doc-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-doc-default.dev2.txt`
(1d)	BM25+RM3 doc segmented	0.2936	0.6189	0.7678	0.1260	0.3834	0.5114	0.1652	0.3452	0.5755	0.1660	0.8608	0.1702	0.8639
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl21.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl22.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl23.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dev.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dev2.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-doc-segmented-default.dev2.txt`

(2a)	BM25 w/ doc2query-T5 doc	0.2387	0.5792	0.7066	0.0977	0.3539	0.4301	0.1273	0.3511	0.5549	0.2011	0.8614	0.2012	0.8568
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5 \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl21.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5 \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl22.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5 \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl23.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5 \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dev.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5 \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dev2.txt \ --bm25` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-d2q-t5-doc-default.dev2.txt`
(2b)	BM25 w/ doc2query-T5 doc segmented	0.2683	0.6289	0.7202	0.1203	0.3975	0.4984	0.1460	0.3612	0.5967	0.2226	0.8982	0.2234	0.8952
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5 \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl21.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5 \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl22.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5 \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl23.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5 \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dev.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5 \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dev2.txt \ --bm25 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-d2q-t5-doc-segmented-default.dev2.txt`
(2c)	BM25+RM3 w/ doc2query-T5 doc	0.2611	0.5375	0.7574	0.0904	0.2758	0.4263	0.1246	0.2681	0.5616	0.1141	0.8191	0.1170	0.8247
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5-docvectors \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl21.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5-docvectors \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl22.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5-docvectors \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl23.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5-docvectors \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dev.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc.d2q-t5-docvectors \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dev2.txt \ --bm25 --rm3` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-default.dev2.txt`
(2d)	BM25+RM3 w/ doc2query-T5 doc segmented	0.3191	0.6559	0.7948	0.1319	0.3912	0.5188	0.1699	0.3454	0.6006	0.1975	0.9002	0.1978	0.8972
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5-docvectors \ --topics dl21 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl21.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5-docvectors \ --topics dl22 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl22.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5-docvectors \ --topics dl23 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl23.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5-docvectors \ --topics msmarco-v2-doc-dev \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dev.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.d2q-t5-docvectors \ --topics msmarco-v2-doc-dev2 \ --output run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dev2.txt \ --bm25 --rm3 --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.bm25-rm3-d2q-t5-doc-segmented-default.dev2.txt`

(3a)	uniCOIL (noexp): cached queries	0.2587	0.6495	0.6787	0.1180	0.4165	0.4779	0.1413	0.3898	0.5462	0.2231	0.8987	0.2314	0.8995
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics dl21-unicoil-noexp \ --output run.msmarco-v2-doc.unicoil-noexp.dl21.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.unicoil-noexp.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.unicoil-noexp.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.unicoil-noexp.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics dl22-unicoil-noexp \ --output run.msmarco-v2-doc.unicoil-noexp.dl22.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.unicoil-noexp.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.unicoil-noexp.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.unicoil-noexp.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics dl23-unicoil-noexp \ --output run.msmarco-v2-doc.unicoil-noexp.dl23.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.unicoil-noexp.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.unicoil-noexp.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.unicoil-noexp.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics msmarco-v2-doc-dev-unicoil-noexp \ --output run.msmarco-v2-doc.unicoil-noexp.dev.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil-noexp.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil-noexp.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics msmarco-v2-doc-dev2-unicoil-noexp \ --output run.msmarco-v2-doc.unicoil-noexp.dev2.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil-noexp.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil-noexp.dev2.txt`
(3b)	uniCOIL (w/ doc2query-T5): cached queries	0.2718	0.6783	0.7069	0.1400	0.4451	0.5235	0.1554	0.4149	0.5753	0.2419	0.9122	0.2445	0.9172
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics dl21-unicoil \ --output run.msmarco-v2-doc.unicoil.dl21.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.unicoil.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.unicoil.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.unicoil.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics dl22-unicoil \ --output run.msmarco-v2-doc.unicoil.dl22.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.unicoil.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.unicoil.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.unicoil.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics dl23-unicoil \ --output run.msmarco-v2-doc.unicoil.dl23.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.unicoil.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.unicoil.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.unicoil.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics msmarco-v2-doc-dev-unicoil \ --output run.msmarco-v2-doc.unicoil.dev.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics msmarco-v2-doc-dev2-unicoil \ --output run.msmarco-v2-doc.unicoil.dev2.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil.dev2.txt`

	uniCOIL (noexp): PyTorch	0.2587	0.6495	0.6787	0.1180	0.4165	0.4779	0.1413	0.3898	0.5462	0.2231	0.8987	0.2314	0.8995
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics dl21 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-noexp-otf.dl21.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics dl22 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-noexp-otf.dl22.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics dl23 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-noexp-otf.dl23.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.unicoil-noexp-otf.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics msmarco-v2-doc-dev \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-noexp-otf.dev.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil-noexp-otf.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil-noexp-otf.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-noexp-0shot \ --topics msmarco-v2-doc-dev2 \ --encoder castorini/unicoil-noexp-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-noexp-otf.dev2.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil-noexp-otf.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil-noexp-otf.dev2.txt`
	uniCOIL (w/ doc2query-T5): PyTorch	0.2718	0.6783	0.7069	0.1400	0.4451	0.5235	0.1554	0.4150	0.5753	0.2419	0.9122	0.2445	0.9172
TREC 2021 TREC 2022 TREC 2023 dev dev2 Command to generate run on TREC 2021 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics dl21 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-otf.dl21.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl21-doc run.msmarco-v2-doc.unicoil-otf.dl21.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl21-doc run.msmarco-v2-doc.unicoil-otf.dl21.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl21-doc run.msmarco-v2-doc.unicoil-otf.dl21.txt` Command to generate run on TREC 2022 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics dl22 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-otf.dl22.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl22-doc run.msmarco-v2-doc.unicoil-otf.dl22.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl22-doc run.msmarco-v2-doc.unicoil-otf.dl22.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl22-doc run.msmarco-v2-doc.unicoil-otf.dl22.txt` Command to generate run on TREC 2023 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics dl23 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-otf.dl23.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m map dl23-doc run.msmarco-v2-doc.unicoil-otf.dl23.txt python -m pyserini.eval.trec_eval -c -m ndcg_cut.10 dl23-doc run.msmarco-v2-doc.unicoil-otf.dl23.txt python -m pyserini.eval.trec_eval -c -m recall.1000 dl23-doc run.msmarco-v2-doc.unicoil-otf.dl23.txt` Command to generate run on dev queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics msmarco-v2-doc-dev \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-otf.dev.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil-otf.dev.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev run.msmarco-v2-doc.unicoil-otf.dev.txt` Command to generate run on dev2 queries: `python -m pyserini.search.lucene \ --threads 16 --batch-size 128 \ --index msmarco-v2-doc-segmented.unicoil-0shot \ --topics msmarco-v2-doc-dev2 \ --encoder castorini/unicoil-msmarco-passage \ --output run.msmarco-v2-doc.unicoil-otf.dev2.txt \ --impact --hits 10000 --max-passage-hits 1000 --max-passage` Evaluation commands: `python -m pyserini.eval.trec_eval -c -M 100 -m recip_rank msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil-otf.dev2.txt python -m pyserini.eval.trec_eval -c -m recall.1000 msmarco-v2-doc-dev2 run.msmarco-v2-doc.unicoil-otf.dev2.txt`

MS MARCO V2 Document Regressions

Programmatic Execution