ML Description
Motto: Všechno je simulace!
Základy ::
Simulace ::
Rozpady ::
Globál
Základy
-
Ve srážkách protonů se rodí nové částice. Procesy nastávají náhodně, ale s předpověditelnou četností. Jedním z nich je produkce top kvarku t. Podle druhu procesu může top kvarků v jedné srážce vzniknout 1, 2 (pozorovány), 3 či 4 (hledají se).
V detektoru nikdy nevidíme top kvark, pouze jeho produkty rozpadu. Jedna fotka z detektoru = jedna srážka. V jedné fotce může být mnoho částic a jejich spršek, jetů. Při srážce se protony rozbijí, v detektoru pozorujeme nejen tzv. tvrdý proces, kdy srážkou částí protonů (partonů = kvarků a gluonů) vzniklo něco zajímavého, ale také doprovodné částice ze zbytků protonů. V realitě dále nastává k vícenásobným srážkám v rámci jednoho snímku detektoru (eventu), ale na odstranění vlivu toho jevu na podobu srážek v detektoru již existují známé techniky. Budeme tedy pracovat v režimu jedna srážka = jedna fotka.
-
Procesů, které pak v detektoru vypadají podobně jako top kvark(y) je více, a cílem je klasifikovat události, kde vznikl top kvark, na základě vlastností tzv. jetů, které v detektoru pozorujeme, a to za účelem potlačení pozadí (vybrat/zamítnout události, eventy) a za účelem identifikace jetů v dané události, které mají šanci pocházet z t či W.
-
Top kvark se rozpadá na částice zvané W boson a b kvark. Kvark b už v detektoru dává vznik spršce částic (jetu). W boson si v simulaci necháváme dále rozpadnout na pár kvarků, z nichž každý může dát jet, popř. se jety mohou "slít" do jednoho.
-
Top kvark se také může narodit přes intermediální částici Z', která není součástí standardního modelu, ale v simulaci slouží jako zdroj top kvarků. Protože je velmi těžká (a její hmotu si můžeme zvolit:), top kvarky, které z ní pocházejí mají velkou příčnou hybnost pT, a jejich produkty rozpadů jsou silně kolimovány. Pokud se všechny sejdou do jednoho širokého výtrysku částic v detektoru, jetu, mluvíme o boosted top jetu. Pokud je hybnost top kvarku menší, může být b jet úhlově separován, ale může zůstat W boosted jet. V plně rozlišeném případě, který dominuje malým hybnostem, jsou všechny 3 jety (dva z W a jeden z b) úhlově odlišitelné. Jetů však může být přítomno více, jejich produkce doprovází produkci top kvarků, a top i b mohou další částice, které dávají vznik jetům, emitovat.
-
V boosted t/W jetech je však možné najít podstrukturu, jet substructure, která bývá popsána veličinami τ32 a τ21, což jsou poměry proměnných τn zvaných n-subjettiness, které říkají, jak moc je jet konzistentní s tím, že obsahuje n podjetů. Menší τn znamená větší míru konzistence s n podjety.
Simulace a vzorky
-
Srážku protonů simuluje program MadGraph5, automatizovaný Monte Carlo generátor částic a jejich kinematiky na základě teoretické znalosti pravděpodobnosti toho, že daný proces proběhne (je dáno tzv. Feynmanovými diagramy a aplitudou rozptylu) v daném bodě hybnostního prostoru částic jakou jsou t, W, b atd. Další program, Pythia8, dodá další částice, které vyzařují kvarky, a provede jejich rozpad na reálné pozorovatelné částice, které mají dostatečně dlouhou dobu života, aby doletěly do detektoru. Detektor je simulový balíčkem Delphes, který vytvoří zásahy v detektoru a zrekonstruuje jety na základě algoritmu FastJet. Protože jde o simulaci, tak jety jsou k dispozici i na částicové úrovni, před vstupem detektoru. Částicová úroveň je ideální co se týče rozlišení apod. a slouží jako kontrolní úroveň, na kterou by měla mít dobrou korespondenci úroveň detektorová, na které 'žijí' reálná data.
- Hypoteticka Z' castice, ktera se rozpada na 2t, ktere jsou timto vice nastreleny a maji vetsi pT a vetsi sanci, ze v detektoru udelaji ty jety s podstrukturou, z ktere lze usuzovat na t/W origin. V kontrolnich obr. je dobre videt peakovani jetu tohoto samplu v ΔR vuci t ci W vice u nuly, tj. je tam jasnesi prislusnost tech jetu k truth t a W a verneji definovana truth kategorie.
- 2t vzorek je predvybran tak, ze na nejniternejsi urovni
alespon jedna castice t ma pT vetsi nez 50. Tohle posiluje ten rezim,
kde W a t castice jsou rychle, maji velke pT davaji vznik kolimovanym
jetum s podstrukturou. V praxi se podobny cut stejne v offline analyze
delaji, tj pro prakticke ucely nejde o biasovani vzorku.
- Format radky Apr2019:
ijet mindrw mindrt pT η φ τ32 τ21 mass; ...
Priklad radky:
nJets|njets|0 2.81974 0.244226 162.528 -1.80893 0.0483639 0.617902 0.541382 90.7653;
1 2.36965 2.74868 141.088 0.692607 -1.69792 0.688324 0.348372 29.502; 2
0.765209 0.283106 138.685 -1.46267 2.56455 0.704988 0.760296 46.1967;
kde nJets je počet velkých jetů (mají poloměr R okolo 1.), které se snažíme tagovat, njets je počet malých jetů (R=0.4, netagujeme je); mindrw a mindrt jsou vzdalenosti daneho jetu k nejblizsimu W a t;
metrika: ΔR = sqrt( Δη2 + Δφ2),
tj. Euklid. metrika v prostoru η x φ kde (jen pro info) η = -ln tg θ/2. φ je cyklická:)
Experiment ATLAS používá pravotočivý souřadný systém, kdy osa z koresponduje s jedním ze svazků protonů, osa x míří dovnitř kruhu urychlovače LHC a osa y nahoru. Úhel φ je měřen od osy x a úhel θ od osy z.
- t a W kategorie omezme v hmote jetu:
Definujme Jet jako truth W/t jet nejen na zaklade ΔR matchingu k
truth t/W, ale jeste aby jeho hmota byla v intervalu rekneme 60--110 pro
W, a 150--210 pro t.
Viz 2D obrazky + projekce v Doc.pdf.
Casem rigoroznejsi meze z nejake fitu, prozatim OK.
- truth labelling na zaklade ΔR matchingu:
Podle toho, zda je mensi mindrw ci mindrt bychom tedy mohli preferovat
prislusnost k t ci W truth kategorii a zrusit tW kategorii.
Ale stale je potreba nejaka minimalni hodnota ΔR, abychom rekli, ze jde
o danou kategorii. V minulych datech jsem to definoval na zaklade toho,
kdyz ΔR bylo mensi nez 0.5, ted se klonim k utazeni na 0.25 pro W ΔR matching, a možná i pro t matching.
Ten 2t vzorek ma bohuzel mene se peakujici ΔR jetu k t, nez mel ten
4t vzorek, nad tim jeste premyslim, proc...
Takze ΔR < neco a pozadavek hmoty v intervalu, a jinak definovat
jako light category.
Obecne z obrazku minimalnich ΔR jetu k t ci W to neni uplne jasne, jak ten cut vest, zejmena pro 4t a 2t vzorky, viz
[divejte se na obrazky vpravo na detektorove urovni:)]
Rozpadový řetízek
-
Kazdy t se rozpadne na W a b. Z b se stane jet, a z W
zase dva lehke kvarky a z nich ~2 jety. Plus ale vzdycky nejaky
'bordel' ze zbytku protonu ve srazce, ktery taky dela jety:) Ale b a ty
2 kvarky, na ktere se rozpadl W, se mohou dale rozstepit na dalsi jety;
vets. s malym pT, a spise ve smeru puvodniho kvarku, odtud
jet=kolimovana sprska castic; ale nekdy se z toho vyloupne jet pod
velkym uhlem, ktery muze vest na light jet.
Odtud nejasnost kategorii a rozmyvani hmotovych peaku.
Globální charakteristiky událostí
-
Ve vzorku Z' → 2t čekáme 2 true W částice a 2 true t částice. Rekonstruované detektorové jety mohou být samořejmě úhlově blízko jak W tak t, a to jak dílem náhody či dílem toho, že daná částice se rozpadla stabilní částice, které daly vznik danému jetu.
- Nutný předvýběr: nebrat události, kde je jen 1 jet, zaměřit se na nejméně dva jety.
- V události, kde je celková suma pT jetů velká lze čekat více t/W-like jetů. Tj. šlo by dále kategorizovat na základě sumy HT = Σ pT
- Obdobně, větší počet jetů = menší šance na to, že budou boosted a tedy že pocházejí z t/W. Počet jetů njets a HT budou korelovány.
- Podívat se pro případný větší počet diskrétních tagging operation points a algoritmů na ROC curve: light-jets rejection rate (= 1 / light jets t tagging eff.) vs t-jets t tagging efficiency.
- JK's TODO: dodat info o počtu malých jetů! Podívat se na korelace mezi dRtmin a dRWmin pro jednotlivé jety. Podívat se na korelace mezi dRtmin a dRWmin pro blízké jety (v ΔR)
- Idea: pokusit se najít velmi čistý 2t vzorek: tag-and-probe metoda: na 2t vzorku si vybrat události, kde jsou jety s nejlepším dRtmin back-to-back, tj. jejich Δφ je okolo 180 stupňů (řekněme 160 a více). Pokud má jeden jet dobrou hmotu a korespondenci na t, tak můžeme předpokládat, že i druhý jet by měl korespondovat truth t, a lze měřit efektivitu taggingu či dle toho nastavit kritéria.