Вісник Львівського університету. Серія фізична 58 (2021) с. 72-84
DOI: https://doi.org/10.30970/vph.58.2021.72

Параметризація рангово-частотних розподілів послідовностей нуклеотидів у вірусних РНК

М. Гусєв, А. Ровенчак

У роботі проаналізовано параметризацію рангово-частотних розподілів та частотних спектрів для нуклеотидних послідовностей у вірусних РНК, які отримано шляхом заміни найчастотнішого нуклеотиду в геномі на розділювач («пробіл»). На підставі рангово-частотних розподілів розраховано такі параметри: ентропія, середня довжина послідовності, дисперсія довжини послідовності, коефіцієнт дисперсії. Частотні спектри апроксимовано модифікованим розподілом Бозе, в якому звичайну експоненту замінено на каппа-експоненту Каніадакіса, що дозволяє точніше відтворювати спостережувані «хвости» розподілів. Ми очікуємо, що запропоновані параметри можуть бути корисними для майбутніх досліджень, наприклад, через встановлення кореляції їхніх значень із іншими характеристиками вірусів.

Текст статті (pdf)


Список посилань
  1. Sung W. Statistical Physics for Biological Matter. Springer, 2018. doi:10.1007/978-94-024-1584-1.
  2. Kuzmak A., Carmali Sh., von Lieres E., Russell A. J., Kondrat S. Can enzyme proximity accelerate cascade reactions? Sci. Rep. 2019. Vol. 9, Article 455. doi:10.1038/s41598-018-37034-3.
  3. Abetz V., Kremer K., Müller M., Reiter G. Functional macromolecular systems: Kinetic pathways to obtain tailored structures. Macromol. Chem. Phys. 2019. Vol. 220, No. 2. Article 1800334. doi:10.1002/macp.201800334.
  4. Honchar Yu., von Ferber C., Holovatch Yu. Variety of scaling laws for DNA thermal denaturation. Physica A. 2021. Vol. 573. Article 125917. doi:10.1016/j.physa.2021.125917
  5. Analysis of Complex Networks: From Biology to Linguistics / edited by M. Dehmer, F. Emmert-Streib. Weinheim: Wiley, 2009.
  6. Qian H. Stochastic physics, complex systems and biology. Quant. Biol. 2013. Vol. 1, No. 1. P. 50–53. doi:10.1007/s40484-013-0002-6.
  7. Babič M., Mihelič J., Calì M. Complex network characterization using graph theory and fractal geometry: The case study of lung cancer DNA sequences. Appl. Sci. 2020. Vol. 10, No. 9. Article 3037. doi:10.3390/app10093037.
  8. Rovenchak A. Telling apart Felidae and Ursidae from the distribution of nucleotides in mitochondrial DNA. Mod. Phys. Lett. B. 2018. Vol. 32, No. 5. Article 1850057. doi:10.1142/S0217984918500574
  9. Husev M., Rovenchak A. On the verge of life: Distribution of nucleotide sequences in viral RNAs. Biosemiotics. 2021. doi:10.1007/s12304-021-09403-5.
  10. Brendel V., Beckmann J. S., Trifonov E. N. Linguistics of nucleotide sequences: Morphology and comparison of vocabularies. J. Biomol. Struct. Dyn. 1986. Vol. 4, No. 1. P. 11–21. doi:10.1080/07391102.1986.10507643.
  11. Botstein D., Cherry J. M. Molecular linguistics: Extracting information from gene and protein sequences. Proc. Natl Acad. Sci. 1997. Vol. 94, No. 11. P. 5506–5507. doi:10.1073/pnas.94.11.5506.
  12. Ferrer-i-Cancho R., Hernández-Fernández A., Baixeries J., Dębowski Ł., Mačutek J. When is Menzerath–Altmann law mathematically trivial? A new approach. Complexity. 2014. Vol. 13, No. 6. P. 633–644. doi:10.1002/cplx.21429.
  13. Faltýnek D., Matlach V., Lacková Ľ. Bases are not letters: On the analogy between the genetic code and natural language by sequence analysis. Biosemiotics. 2019. Vol. 12, No. 2. P. 289–304. doi:10.1007/s12304-019-09353-z.
  14. Ji S. The molecular linguistics of DNA: Letters, words, sentences, texts, and their meanings. Theoretical Information Studies: Information in the World / edited by M. Burgin, G. Dodig-Crnkovic. Singapore: World Scientific, 2020. P. 187–231. doi:10.1142/9789813277496_0010.
  15. Corral Á., Font-Clos F. Dependence of exponents on text length versus finite-size scaling for word-frequency distributions. Phys. Rev. E. 2017. Vol. 96, No. 2. Article 022318. doi:10.1103/PhysRevE.96.022318.
  16. Yan X., Yang S.-G., Kim B. J., Minnhagen P. Benford's law and first letter of words. Physica A. 2018. Vol. 512. P. 305–315. doi:10.1016/j.physa.2018.08.133.
  17. Mazzolini A., Grilli J., De Lazzari E., Osella M., Cosentino Lagomarsino M., Gherardi M. Zipf and Heaps laws from dependency structures in component systems Phys. Rev. E. 2018. Vol. 98, No. 1. Article 012315. doi:10.1103/PhysRevE.98.012315.
  18. DeGiuli E. Random language model Phys. Rev. Lett. 2019. Vol. 122, No. 12. Article 128301. doi:10.1103/PhysRevLett.122.128301.
  19. Гусєв М., Ровенчак А. Розподіл нуклеотидних послідовностей у вірусних РНК. Міжнародна конференція студентів і молодих науковців з теоретичної та експериментальної фізики “Еврика-2021”: тези доповідей, Львів, 18–19 травня 2021 р. С. H2.
  20. Kelih E., Antić G., Grzybek P., Stadlober E. Classification of author and/or genre? The impact of word length. Classification – The Ubiquitous Challenge / edited by C. Weihs, W. Gaul. Heidelberg: Springer, 2005. P. 498–505. doi:10.1007/3-540-28084-7_58.
  21. Buk S., Humenchyk O., Mal'tseva L., Rovenchak A. Word-length-related parameters of text genres in the Ukrainian language. A pilot study. Text and Language: Structures - Functions - Interrelations. Quantitative perspectives / edited by P. Grzybek, E. Kelih, J. Mačutek. Wien: Praesens, 2010. P. 13–19.
  22. Alberts B., Johnson A., Lewis J., Raff M., Roberts K., Walter P. Molecular Biology of the Cell, 6th edn. New York: Garland Science, 2015.
  23. Patton J. T. Segmented Double-stranded RNA Viruses: Structure and Molecular Biology. Caister Academic Press, 2008.
  24. Kaniadakis G. Non-linear kinetics underlying generalized statistics. Physica A. 2001. Vol. 296. P. 405-425. doi:10.1016/S0378-4371(01)00184-4.
  25. Kaniadakis G., Theoretical foundations and mathematical formalism of the power-law tailed statistical distributions., Entropy. 2013. Vol. 15, No. 10. P. 3983–4010. doi:10.3390/e15103983.
  26. Колесниченко А. В. К построению статистической термодинамики неэкстенсивных систем на основе каппа-энтропии Каниадакиса. Math. Montisnigri. 2020. Vol. 48. P. 118–144. doi:10.20948/mathmontis-2020-48-10.
  27. Bouvier N. M., Palese P. The biology of influenza viruses. Vaccine. 2008. Vol. 26, Suppl. 4. P. D49–D53. doi:10.1016/j.vaccine.2008.07.039.
  28. Rovenchak A., Buk S. Application of a quantum ensemble model to linguistic analysis. Physica A. 2011. Vol. 390, No. 7. P. 1326–1331. doi:10.1016/j.physa.2010.12.009.