К 70-летию Фортрана. Историческая справка. Часть I
Когда умрёт последний программист на $(вашем любимом языке), его тело отвезут на кладбище на катафалке, конструкция которого будет рассчитана на Фортране, а счёт на организацию похорон сформирует программа, написанная на Коболе (Старинная американская мудрость).
В 2023 году исполняется 70 лет с того момента, как Джон Бэкус, сотрудник IBM, убедил начальство утвердить проект первого в мире языка программирования высокого уровня. Как настоящий уважающий себя программист того времени, Бэкус занимался расчётом траекторий баллистических ракет, и его очень раздражало писать такие вещи на ассемблере, а тем более — руководить разработкой таких вещей на ассемблере. В итоге команда из 10 программистов под руководством Бэкуса разработала язык Фортран и первый компилятор для машины IBM 704, представив первые результаты в 1954 году и затратив на разработку 18 человеко-лет. Попутно для формализованного описания синтаксиса Фортрана была разработка ставшая классической форма Бэкуса-Наура (БНФ).
Условно эволюцию языка Фортран можно разделить на классический период (Фортран I — Фортран IV), когда ведущую роль в разработке занимала фирма IBM, язык абсолютно доминировал среди программистов (особенно в США) и сохранял значительную преемственность с самой первой версией; и современный период (Фортран 90 — Фортран 2018), когда разработка велась в основном ISO, синтаксис и семантика языка были значительно осовременены, но, несмотря на это, язык был уже вытеснен на периферию инструментальных средств. Версия Фортран 77, не получившая широкого распространения вследствие доминирования Фортрана IV, занимает промежуточное положение между этими периодами.
Фортран I
Первая версия языка Фортран (которую условно можно было бы назвать Фортран I или Фортран 54) не слишком сильно отличалась от макроассемблера. Основным отличием была возможность записывать арифметические выражения так, как это сейчас общепринято в программировании, то есть похоже на математические формулы (собственно, название Фортран расшифровывается как Формульный транслятор).
Программа на Фортране I записывалась в виде одного монолитного модуля. Всего было реализовано 32 оператора, среди них такие управляющие конструкции, как GOTO
(безусловный переход на метку или переход на метку, записанную в значение переменной), цикл DO
с меткой конца цикла и арифметический IF
(выполнявший переход на одну из трёх меток в зависимости от знака указанного в нём арифметического выражения — отрицательное, ноль или положительное). Также в Фортране I были специальные формы оператора IF
для проверки различных флажков процессора IBM 704. Фортран I сразу же включал различные формы операторов форматного и бесформатного ввода-вывода, в том числе специальные операторы для управления магнитной лентой и магнитным барабаном.
Всё распределение памяти в классическом Фортране было статическим. Допускались простые целочисленные и вещественные переменные и массивы.
В ранних версиях Фортрана тип переменной определялся строго по её имени. Если имя начиналось с букв I, J, K, L, M, N, то переменная была целой, иначе — вещественной. При этом в целочисленных и вещественных переменных также можно было содержать значения меток (т.е. адресов) и строк символов фиксированной длины, совпадающих с базовым типом по объёму памяти. Массивы в Фортране I могли иметь до 3 измерений, а их размерность задавалась отдельным оператором DIMENSION
(потерявшим популярность, но дошедшим до наших дней), не связанным с определением типа.
Очень долгое время, весь классический период, строки символов находились в Фортране на таком положении бедного родственника, не имея даже собственного типа переменных, не говоря о произвольной длине. Строковые значения записывались в виде так называемых «холлеритовых констант», имевших вид длинаHсимволы, например, 5HALPHA
. Интересной особенностью Фортрана является то, что холлеритовы (и позднее шестнадцатиричные) константы считаются не имеющими типа. Это просто заполненные области памяти машины, которые принимают тип по способу своего использования. Поскольку классический Фортран разрабатывался в то время, когда байтовая организация памяти сначала не была изобретена, а потом не имела повсеместного использования, то холлеритовы константы не имели определённого языком размера в памяти, их длина в словах зависела от реализации. Например, константа 5HALPHA
могла занимать 30 бит в 6-битовой кодировке в одном 48-битовом слове на одной машине (и тогда могла храниться в одной целой или вещественной переменной), либо 40 бит в 8-битной кодировке в двух 32-битовых словах на другой машине (и тогда могла храниться в массиве из двух целых или вещественных чисел).
Таким образом, ранний Фортран формально был языком со статической явной типизацией, в котором отсутствовали описания типов и имелись бестиповые значения.
Так как всё управление ходом вычислений в раннем Фортране было основано на метках и их использовании в различных операторах, то текст программы, как правило, представлял собой классические логические спагетти. От этого недостатка удалось уйти только к концу 20 века. Википедия приводит следующий пример программы на Фортране II, который также мог бы относиться и к Фортрану I:
C AREA OF A TRIANGLE WITH A STANDARD SQUARE ROOT FUNCTION
C INPUT - TAPE READER UNIT 5, INTEGER INPUT
C OUTPUT - LINE PRINTER UNIT 6, REAL OUTPUT
C INPUT ERROR DISPLAY ERROR OUTPUT CODE 1 IN JOB CONTROL LISTING
READ INPUT TAPE 5, 501, IA, IB, IC
501 FORMAT (3I5)
C IA, IB, AND IC MAY NOT BE NEGATIVE OR ZERO
C FURTHERMORE, THE SUM OF TWO SIDES OF A TRIANGLE
C MUST BE GREATER THAN THE THIRD SIDE, SO WE CHECK FOR THAT, TOO
IF (IA) 777, 777, 701
701 IF (IB) 777, 777, 702
702 IF (IC) 777, 777, 703
703 IF (IA+IB-IC) 777, 777, 704
704 IF (IA+IC-IB) 777, 777, 705
705 IF (IB+IC-IA) 777, 777, 799
777 STOP 1
C USING HERON'S FORMULA WE CALCULATE THE
C AREA OF THE TRIANGLE
799 S = FLOATF (IA + IB + IC) / 2.0
AREA = SQRTF( S * (S - FLOATF(IA)) * (S - FLOATF(IB)) *
+ (S - FLOATF(IC)))
WRITE OUTPUT TAPE 6, 601, IA, IB, IC, AREA
601 FORMAT (4H A= ,I5,5H B= ,I5,5H C= ,I5,8H AREA= ,F10.2,
+ 13H SQUARE UNITS)
STOP
END
Очень интересной особенностью Фортрана I был операторFREQUENCY
. Он представлял собой подсказку для компилятора к арифметическому IF
, и в этом операторе программист задавал априорные вероятности перехода по каждому из трёх возможных путей. Используя эти вероятности, компилятор при трансляции программы выполнял симуляцию методом Монте-Карло (!) и по её результатам принимал решение о наиболее эффективном размещении блоков кода в памяти машины, чтобы уменьшить число переходов.
Операторы Фортрана I размещались в фиксированных позициях перфокарт. Первые 5 позиций были отведены под метку или признак комментария, 6-я позиция — под признак продолжения, позиции с 7 по 72 — под текст оператора, с 73 по 80 — под произвольный текст (обычно там записывался номер перфокарты, чтобы можно было собрать рассыпавшуюся колоду). Такой фиксированный формат сохранялся до конца 20 века, хотя перфокарты перестали использоваться гораздо раньше, а неспособностью воспринимать текст дальше 72 позиции отличался только перфокарточный ввод собственно IBM 704. Пробелы в операторах игнорировались.
В своей статье об успехах разработки первого компилятора Фортрана Бэкус с соавторами утверждал, что после однодневного обучения языку новый программист оказывался в состоянии самостоятельно писать на нём программы, и, например, мог написать программу из 47 операторов Фортрана, которая компилировалась на IBM 704 шесть минут, превращалась при этом примерно в 1000 машинных инструкций, и со второго раза удавалось устранить ошибки и написать работающую программу, которую на ассемблере пришлось бы писать вручную три дня и неизвестно сколько отлаживать. В общем, высокоуровневое программирование показало свою перспективность. Делались даже такие утверждения, что использование Фортрана устраняет необходимость отладки, так как в программах и так сразу всё ясно (ещё раз посмотрев на код выше, можно в свете этого заявления составить представление об уровне способностей людей, которые тогда занимались программированием).
Фортран II
В 1958 году в IBM был реализован язык Фортран II, основным отличием которого от Фортрана I была реализация многомодульных программ в виде раздельно транслируемых главной программы, подпрограмм (процедур) и функций, между которыми могли передаваться параметры и общий блок памяти. Модули программы объединялись только на этапе компоновки, и никакого контроля за совпадением описаний параметров и общего блока в классическом Фортране не было. Если, например, подпрограмма или функция имела формальные параметры с одними типами и количеством, а вызывалась с другими, то получалось нехорошо. Так как к тому же все параметры в классическом Фортране передавались по ссылке, в том числе и константы, то таким образом можно было ненамеренно достигать очень интересных результатов, например, присваивать константам новые значения, передавая их вместо переменных.
Также в Фортран II были добавлены описания простых типов, в том числе новых типов COMPLEX
и DOUBLE PRECISION
. Но основным механизмом описания переменных в классическом Фортране всё равно оставалось описание по умолчанию, в зависимости от первой буквы имени.
Язык Фортран к тому времени пошёл на ура (хотя Дейкстра, разумеется, критиковал его, как и вообще всё, в чём он или его друзья не имели личного интереса) и заинтересовал других производителей компьютеров, помимо IBM. Стали появляться первые альтернативные реализации.
Довольно известный старый тест производительности Whetstone написан на языке Фортран II.
Фортран III
Версия языка Фортран III была внутренним продуктом IBM, который позволял использовать в программах ассемблерные вставки для IBM 704 (естественно, не понадобилось впоследствии) и использовать логические выражения и формат типа »А
» для ввода-вывода строковых данных (понадобилось впоследствии). Компилятор Фортрана III использовался примерно в 20 экземплярах и не дошёл до стадии коммерческого релиза.
Фортран IV
Версия Фортран IV была реализована в IBM в 1962 году и с небольшими изменениями стандартизована ANSI в 1966. Впоследствии этот стандарт получил неофициальное название Фортран 66. Отчасти благодаря своим востребованным функциям, отчасти благодаря реализации имевшей огромное влияние серии машин IBM S/360 в 1964 году, Фортран IV получил ошеломительный успех и стал доминирующим языком программирования на следующую четверть века, вплоть до кризиса мейнфреймов. На Фортране IV были написаны все основные библиотеки физических и инженерных расчётов, многие из которых используются до сих пор. Если рассматривать причины использования Фортрана в настоящее время, то основной из них является совместимость с кодом, разработанным на Фортране IV.
Фортран IV унаследовал от Фортрана III логические выражения и позволил писать что-то хотя бы отчасти напоминающее современные условные операторы — логический IF
с одним оператором в его теле, которым чаще всего по понятным причинам оказывался GOTO
.
С логическими выражениями всё было не совсем прекрасно, потому что на клавиатурах того времени зачастую не было символов сравнения, и в Фортране IV было принято решение заменять их буквенными обозначениями в точках, такими как .GT.
вместо «больше», .LT.
вместо «меньше», .NE.
вместо «не равно» и т.д.
Появились более чем трёхмерные массивы, указание размеров переменных в байтах и много других небольших, но существенных улучшений.
Пример программы на Фортране IV:
INTEGER*4 NOBJ, NUMTRA, NIS
REAL*8 DT
INTEGER*4 NP
REAL*8 TOBJTR, OBJTR1, OBJTR2
NOBJ = 2
WRITE (1) NOBJ
DO 2 I = 1, NOBJ
NUMTRA = I * 2
NIS = I * 2 + 10
WRITE (1) NUMTRA, NIS
DT = 1E-4
NP = 2
WRITE (1) DT, NP
K = NUMTRA / 2
DO 1 J = 1, K
TOBJTR = 100. + J
OBJTR1 = .11
OBJTR2 = .12
WRITE (1) TOBJTR, OBJTR1
IF (J.NE.K) WRITE (1) TOBJTR, OBJTR2
1 CONTINUE
2 CONTINUE
STOP
END
Отметим здесь оператор останова STOP
, которым принято было заканчивать программу, хотя фактически он, находясь в конце программы, ничего не делал, а в середину его было ставить уже как-то не принято, так как идеи структурного программирования понемногу овладевали массами.
Вместе с Фортраном развивались теория и практика компиляции, что позволило создавать очень сложные оптимизирующие компиляторы. Например, уже для IBM 1401 был реализован 63-проходный компилятор.
Вершиной изысканий IBM являлся оптимизирующий компилятор FORTRAN IV уровня H для OS/360 и совместимых систем. Компилятор FORTRAN IV (H) был настолько хорош, что в дальнейшем программисты систем IBM практически проигнорировали появление компилятора Фортрана 77 со значительно более удобным языком, так как код, порождаемый старым компилятором, был эффективнее. Аналогичная ситуация складывалась и у других производителей.
Наиболее вычислительно производительные компьютеры Cyber в то время выпускала фирма CDC (их главный конструктор, Сеймур Крей, впоследствии организовал собственную фирму). Для компьютеров CDC был разработан очень мощный компилятор Фортрана 66, получивший огромную популярность среди физиков во всём мире (этот компилятор в CDC пытались назвать FORTRAN V, чтобы выглядеть превзошедшими IBM на поколение, но название не прижилось). Для советской машины БЭСМ-6, на архитектуру которой в целом оказала значительное влияние CDC, был реализован компилятор, полностью совместимый с CDC FORTRAN.
В целом, любая машина того периода, претендующая на проведение расчётов, должна была иметь хороший компилятор Фортрана IV. И даже многие не претендующие на такое машины, например, 8-разрядный домашний компьютер Apple II, имели компиляторы Фортрана.
Очевидным производным от Фортрана IV является классический Бейсик семидесятых-восьмидесятых годов (с номерами строк).
Фортран IV имел развитую систему ввода-вывода, но характерную для своего времени проблему: внешнюю привязку файлов. Поскольку в то время файловые системы в современном виде ещё не были изобретены, то программы на Фортране IV работают с файлами просто по номерам. Вопрос о том, как из этого номера получается реальное имя (если оно есть) и размещение файла, никак не регулируется языком. На практике, операционные системы шестидесятых годов обеспечивали привязку специальными операторами языка управления заданиями, которые исполнялись операционной системой до запуска фортрановской программы. Этими операторами задавалось, например, что фортрановский файл номер 6 привязан к системному принтеру, а файл номер 1 привязан к определённой области на диске. Некоторые поздние реализации обеспечивали привязку файлов путём нестандартного для того времени оператора OPEN
.
Фортран 77
К 70-м годам фирма IBM несколько охладела к Фортрану, который пыталась заменить разработанным ей более совершенным языком PL/I, включающим все возможности Фортрана, Кобола, Алгола и многое сверх того. Некоторые программисты действительно перешли на PL/I, но многие, особенно среди учёных, не занимающихся программированием профессионально, продолжали программировать на Фортране IV. У них было три аргумента против PL/I: Фортран IV — простой для изучения язык, на Фортране IV написано много кода и Фортран IV имеет более эффективный компилятор.
На фоне этой возни, созданный в ANSI комитер X3J3, с 1966 года занимавшийся Фортраном, разработал новый стандарт Фортран 77. Это был более продвинутый язык, чем Фортран 66, который стандартизовал многие расширения IBM, имевшиеся в Фортране IV, но не вошедшие в стандарт Фортран 66, а сверх того Фортран 77 включал: символьный тип, блочный оператор IF
, операторы OPEN
и CLOSE
, оператор PARAMETER
для констант и ещё разное по мелочи. Также стандартом Фортран 77 впервые были запрещены выход за границу массива и переход оператором GOTO
внутрь цикла (из чего можно сделать вывод, какие не омрачённые условностями нравы царили в программировании до того).
IBM и другие фирмы реализовали компиляторы Фортрана 77 (причём в компиляторе IBM даже предусматривалась опциональная возможность уйти от синтаксиса с фиксированными позициями).
В 1978 году американские военные выкатили свой стандарт MIL-STD-1753, стандартизующий расширения Фортрана 77, сделанные компьютерными фирмами, в основном CDC и IBM. Среди этих расширений был структурный оператор DO
, заканчивавшийся операторной скобкой END DO
, оператор DO WHILE
, операторы CYCLE
и EXIT
для управления выполнением цикла и операторIMPLICIT NONE
для отмены неявного описания переменных по первой букве. Всё это можно было рассматривать, как начало облагораживающего влияния на Фортран языка PL/I.
Однако, ни гражданский, ни военный стандарт Фортрана 77 не был особенно востребован за пределами преподавания в университетах. Как можно легко догадаться, программисты на Фортране выдвигали три аргумента против Фортрана 77: Фортран IV — простой для изучения язык, на Фортране IV написано много кода и Фортран IV имеет более эффективный компилятор.
К 1990 году, когда автор впервые получил возможность зарабатывать на жизнь в том числе и Фортраном, это уже был очень архаичный язык, который, однако, имел значительную сферу применения. Стандарт Фортран 77 не получил значительного распространения, и в ходу среди реально программирующих людей был Фортран IV. Фиксированный формат записи, 6-символьные идентификаторы, только статические переменные, раздельная компиляция, отсутствие блочных операторов и лапша из меток и GOTO
— всё это в любой нише программирования смотрелось довольно странно на фоне таких развитых языков того времени, как PL/I для мейнфреймов и Паскаль и Си для машин поменьше. При этом действительно существовала огромная масса унаследованного программного обеспечения, которое никому не хотелось менять. Фирма Microsoft, например, одними из первых реализовала компиляторы Фортрана для MS-DOS и позже для Windows. Со всем этим следовало что-то делать.
О современном периоде Фортрана (1990–2013) — в следующей статье.