Du verkar tro att vi bör begära kod, för utan kod kan något galet resultat, oavsett om det är bedrägeri eller ärligt misstag, släppas in i tidningen. Men detta är inte så. Inkludering av kod är en trevlig-att-ha-funktion, inte en måste-ha-funktion. De andra svaren antar tyst detta och förklarar de (bra och inte så bra) orsakerna som leder till den nuvarande situationen med ovanligt inkluderad kod. Jag tror att jag kan komplettera dem genom att förklara varför det inte är en måste-ha-funktion.
För teoretiska resultat behöver du inga empiriska verktyg som kod för att reproducera dem, som andra nämnde (t.ex. bevisa att en algoritm har ett bättre stort O-beteende än en annan). Naturligtvis finns det också empiriska resultat, som inte kan replikeras på det sättet.
Men dina granskare kommer att förvänta sig vad din idé kommer att resultera i. Om den nuvarande bästa prestandan för att wugging zums är 3 zums / s, och du lägger till en mindre tweak och rapporterar 300 zums / s, kommer din granskare ska märka att ditt anspråk är ovanligt och göra något (eventuellt kräva att skicka in igen med koden). Detta är inte idiotsäkert, men med flera granskare per papper är det effektivt eftersom storleken på de mest empiriska resultaten är förutsägbar när granskaren ser idén och förstår hur den fungerar.
För denna typ av papper har både ärliga och oärliga misstag goda chanser att fångas, med dåliga resultat för ärliga forskare (rykteförlust, särskilt om de fångas efter publicering) och sämre resultat för oärliga forskare (slut av karriär om bevisat!). Ju större misstaget är (mätt i felstorleken) desto större är chansen att fångas. Det är mindre troligt att du kommer att fastna om din algoritm hanterar 4 zums / s och du rapporterar 5 zums / sekund, än om du rapporterar 300 zums / s. Så, forskare undantas från att skicka in felaktiga papper, lämna mindre felaktiga i den inlämnade poolen, och granskarna fångar mycket av resten.
Det finns fall där det är helt okänt varför en observation är som den är, och i dessa fall är det mycket viktigt att beskriva den exakta testuppsättningen perfekt. Men jag har aldrig sett denna typ av papper inom datavetenskap, det är förknippat med naturvetenskap. Så ingen kod där. Även om du fick sådana resultat inom datavetenskap (t.ex. observerade du att användare kan läsa ett 12000 ord EULA på mindre än 30 sekunder, vilket strider mot vanliga läshastighetsobservationer, och du har ingen förklaring för det), är det osannolikt att inkludera koden du använde för att få resultatet kommer att vara relevant för replikering.
För att sätta ihop det, bland en stor massa datavetenskapliga artiklar, behöver de teoretiska och de naturfenomen-observationerna inte inkludera kod för replikering, och de återstående innehåller endast en låg procent av felaktiga men icke-fångade papper. Sammantaget leder detta till att en acceptabelt låg nivå av felaktiga papper skickas in. Att begära att koden ska följa med kommer att öka kvaliteten för en pappersklass, men det kommer att öka en redan hög kvalitetsnivå. Det är inte det att den nuvarande kvaliteten inte blir för låg om den inte har den här funktionen.