Στις αρχές του 2020, λίγους μήνες μετά της έναρξη της πανδημίας, οι επιστήμονες είχαν καταφέρει να «διαβάσουν» (αλληλουχίσουν) το γονιδίωμα του νέου κορονοϊού. Μολονότι έκτοτε πολλά από τα γονίδιά του είναι γνωστά, αυτό δεν ίσχυε για όλα τα γονίδια του που κωδικοποιούν πρωτεΐνες. Τώρα, μετά από μια εξονυχιστική συγκριτική γονιδιωματική ανάλυση, οι ερευνητές του ΜΙΤ, οι οποίοι έκαναν τη σχετική δημοσίευση στο περιοδικό «Nature Communications», δημιούργησαν τον πιο ακριβή και ολοκληρωμένο γονιδιωματικό «χάρτη» του κορονοϊού. Οι επιστήμονες επιβεβαίωσαν αρκετά ήδη γνωστά γονίδια, αλλά βρήκαν επίσης ότι ορισμένα άλλα που είχαν αρχικά θεωρηθεί ως γονίδια, στην πραγματικότητα δεν ρυθμίζουν πρωτεΐνες.
Το γονιδίωμα του κορονοϊού αποτελείται από σχεδόν 30.000 βάσεις RNA. Έως τώρα οι επιστήμονες δεν ήσαν βέβαιοι ποιες ακριβές περιοχές του γονιδιώματος του ιού περιέχουν σημαντικά γονίδια, τα οποία κωδικοποιούν πρωτεΐνες. Αυτές ήλθαν πλέον στο φως μέσα από τη συγκριτική ανάλυση με τα γονιδιώματα παρόμοιων ιών, όπως του SARS-CoV (που είχε προκαλέσει την επιδημία του 2003) και συγγενικών ιών σε νυχτερίδες.
Ο Κέλλης είχε προηγουμένως αναπτύξει υπολογιστικές τεχνικές ακριβώς γι’ αυτό το είδος συγκριτικής ανάλυσης, οι οποίες είχαν χρησιμοποιηθεί για να γίνει σύγκριση του ανθρώπινου γονιδιώματος με εκείνα άλλων θηλαστικών και τώρα αξιοποιήθηκαν στην περίπτωση του κορονοϊού. Χάρη σε αυτή τη μέθοδο, η νέα έρευνα επιβεβαίωσε έξι νέες περιοχές κωδικοποίησης πρωτεϊνών στο γονιδίωμα του νέου κορονοϊού, πέρα από τις πέντε ήδη γνωστές σε όλους τους κορονοϊούς. Επίσης διαπιστώθηκε ότι πέντε άλλες περιοχές του γονιδιώματος του SARS-CoV-2, αντίθετα με ό,τι είχε υποτεθεί αρχικά, δεν κωδικοποιούν πρωτεΐνες. Ακόμη αποκλείσθηκε η πιθανότητα να υπάρχουν και άλλα γονίδια κωδικοποίησης πρωτεϊνών που μένει να ανακαλυφθούν.