Научно-исследовательское программное обеспечение в ВУЗах Великобритании
От переводчикаВ этой заметке коротко о том:
сколько исследователей пользуется научно — исследовательским программным обеспечением (ПО) в ВУЗах Великобритании? какое именно ПО используется? сколько исследователей разрабатывает свое исследовательское ПО, сколько является просто пользователями исследовательского ПО, как это зависит от дисциплины, их пола и других факторов? какая компьютерная операционная система выбирается разработчиками и пользователями исследовательского ПО? Так же вы найдёте и ссылку на файл с «сырыми» и детальными результатами исследований, такими как список исследованных университетов, число опрошенных человек от каждого университета, область их работы и так далее. Это будет особенно полезным для тех кто пожелает самостоятельно проанализировать результаты.
Данная заметка является переводом публикации «Невозможно проводить исследования без программного обеспечения — отметили 7 из десяти исследователей Соединённого Королевства» (англ. It’s impossible to conduct research without software, say 7 out of 10 UK researchers) автора Саймон Хитрик (анг. Simon Hettrick), в которой он коротко рассказал о результатах статистического исследования программного обеспечения используемого в научных исследованиях нескольких университетов Соединённого Королевства. Саймон является заместителем директора института программной совместимости (анг. Software Sustainability Institute), от имени которого Университет Эдинбурга и проводил данные исследования (англ. The University of Edinburgh on behalf of the Software Sustainability Institute).
Этот литературный перевод с английского на русский. Если будут советы (или видите ошибку), то прошу мне о них сообщать. После публикации этого перевода, я пришлю Саймону ссылку на эту публикацию (разрешение автора на перевод и использование диаграмм из его отчёта у меня уже есть).
Благодарности (англ. асknowledgements): Я хотел бы поблагодарить Саймона Хитрика из поддерживаемого EPSRC Института программной совместимости за его помощь в подготовке материала (англ. I would like to acknowledge the assistance of Simon Hettrick from the EPSRC supported Software Sustainability Institute»).
Далее по тексту — перевод поста Саймона Хитрик.
Никто не знает сколько программного обеспечения (ПО) используется в научных исследованиях. Посмотрите в любую лабораторию и вы обнаружите как стандартное, так и специально написанное ПО, которое используется во всех дисциплинах и исследователями всех уровней. Программное обеспечение явно является фундаментальным компонентом исследований, но мы не можем подтвердить это без доказательств. И этот недостаток доказательств является причиной, по которой мы провели исследование используемого научно — исследовательского ПО в пятнадцати университетах группы Рассела (анг. Russell Group — прим. переводчика).
92% опрошенных используют научно — исследовательское ПО; 69% из них отметили что их исследование было бы непрактичным без такого ПО; 56% разрабатывает своё собственное ПО (но беспокоит то, что 21% из них не имеют тренинга в области разработки программного обеспечения); 70% исследователей мужского пола разрабатывает своё ПО и только 30% исследователей женского пола делают это. Данные, собранные в результате этого статистического исследования, доступны для загрузки и лицензированны под лицензией Creative Commons by Attribution (атрибуция университету Эдинбурга от имени Института программной совместимости). Если мы не знаем насколько мы полагаемся на ПО, то мы не можем и быть уверенны что исследователи имеют инструменты и навыки необходимые для того, чтобы им оставаться лидерами исследований. Впервые, в таком масштабе, мы собрали данные по использованию исследовательского ПО, его разработке и уровню тренинга исследователей. Кроме того мы собрали и демографические данные, настолько, что мы можем ответить такой вопрос как «Наиболее ли вероятна разработка ПО представителями мужского пола чем женского?» (ответ, как оказалось, «да», но женщины и мужчины в равных долях используют исследовательское ПО). Спасибо Марио Антониолетти (англ. Mario Antonioletti — прим. переводчика), Нилу Чуе Хонг (анг. Neil Chue Hong — прим. переводчика), Стиву Кроуч (англ. Steve Crouch — прим. переводчика), Девасена Инупакутика (англ. Devasena Inupakutika — прим. переводчика) и Тиму Паркинсону (англ. Tim Parkinson — прим. переводчика) за их помощь в построении опроса, разработке необходимых программных кодов и анализ результатов. Так же спасибо действительным членам (Института — прим. переводчика) за то, что были «морскими свинками» на время работы с черновиками этого опроса. Результаты опроса, описанные тут, основаны на ответах 417 исследователей, которые были отобраны случайным образом из пятнадцати университетов из группы Рассела. Мы достигли хорошей репрезентативности среди различных дисциплин, уровней исследователей и полов. Это число опрошенных является статистически существенным, для того чтобы представлять мнения сотрудников тех Британских университетов, в которых научная активность находится на высоком уровне. Главная проблема «слепого» опроса заключается в том, что он должен быть коротким для того чтобы мы могли получить максимальное число ответов от респондентов. Это значит что у нас была возможность приоткрыть факты об использовании программного обеспечения, но у нас не было места для исследования отдельных случаев. Мы будем проводить дальнейшие исследования чтобы достичь и этой цели.
Прим. переводчика к изображённым выше диаграммам: в левом верхнем углу — проценты использования или не использования исследовательского ПО; в правом верхнем — частота ответов на предложенные варианты вопроса «Что может случиться, если нельзя будет пользоваться исследовательским ПО?»; в левом нижнем — процент респондентов, которые разрабатывают или не разрабатывают своё исследовательское ПО; в правом нижнем — проценты тех разработчиков которые получили или не получили тренинг в разработке ПО.
Не будет преувеличением, если сказать что ПО жизненно важно для исследований. Если бы неким магическим образом ПО исчезло из исследований, то 7 из 10 исследователей остались бы без работы.92% респондентов отметили, что они использовали исследовательское ПО. Более того, 70% респондентов указали «что проведение моей работы стало бы непрактичным в случае отсутствия такого ПО».
Использование исследовательского ПО слабо зависит от профессионального уровня респондентов.Измерить профессиональный уровень сложно. Поэтому мы просто спросили респондентов о том, сколько лет они проработали в области исследований. Вариация по разным группам не существенна и составляет 12%.
98% из числа тех кто проработал в исследованиях 6–10 лет, отметили что они больше всего использовали исследовательское ПО и из тех кто проработал более 20 лет отметили наименьшее использование на уровне 86%.
Первые две категории — это те, кто проработал меньше года и те кто проработал от одного года до пяти лет отметили что 91–92% из них используют такое ПО. Использование ПО в исследованиях достигает максимума следующие десять лет и потом спадает в группах исследователей с опытом работы в 15–20 лет и дольше.
Существует несколько путей объяснения этой вариации. К сожалению, они не могут быть подтверждены нашими результатами. Похоже на то, что исследователи с начальным и средним профессиональными уровнями являются «рабочими лошадками» в проведении исследований и, вероятнее всего, могут генерировать больше всего результатов, и, следовательно, вероятнее всего используют исследовательское ПО. Как только исследователь достигает более высокого уровня, то появляется тенденция к осуществлению им управленческих функций, что снижает вероятность использования им исследовательского ПО.
Используется множество различных продуктов: мы зарегистрировали 566 различных ПО, некоторые их которых упомянуты только однажды респондентами, но некоторые упомянуты чаще. Самые популярные пакеты Matlab (20% из респондентов им пользуются), R (16%), SPSS (15%) и Excel (12%). Для того чтобы показать список используемых программных пакетов в виде диаграммы, мы собрали облако тэгов показанное в верху этой страницы. Используются не только проприетарные продукты. Многие исследователи пишут свои собственные коды — таких из них 56%. Это замечательная новость, поскольку настоящая сила ПО находится в разработке с целью сделать больше работы за меньший промежуток времени и при этом сделать возможным новые исследования.Многие исследователи разрабатывают своё исследовательское ПО, но в безопасных ли руках эта разработка?
55% респондентов получили некоторый тренинг в области разработки ПО (15% путём самообучения и 40% путём посещения соответствующих курсов). Беспокоит то, что 21% респондентов из числа разработчиков не имеет тренинга в разработке ПО. Это — каждый пятый.
Компьютерные программы, которые разрабатываются без адекватного тренинга, вероятней всего будут не такими, на которые можно будет полагаться. Исследователи, по своей природе, являются интеллектуальными людьми, которые поглощают новые навыки быстро. Но существует множество подводных камней в разработке хороших программ (например, результаты используемого ПО, в будущем, не приведут к отзыву уже опубликованных работ). И это только касательно надёжности! Нам нужны результаты которые можно будет защитить в дальнейшем, которые требуют множество навыков относящихся к написанию воссоздаваемого кода. Мы так же хотим защитить инвестиции в исследования которые требуют ещё больше навыков для написания программ, которые можно будет использовать в дальнейшем.
Информация об основной финансирующей организации определённого исследования является удобным способом разделения респондентов на отдельные дисциплины. Около половины респондентов финансировались организацией EPSRC (Совет инженерных и физических исследований — прим. переводчика), из фондов университетов и из других источников (которые представляют из себя широкий спектр финансирующих организаций от частных до зарубежных). Другая половина респондентов были разделены в достаточно равных долях между оставшимися исследовательскими советами, фондами ЕС и крупными благотворительными организациями.Использование исследовательского программного обеспечения практически однородно среди респондентов и не зависимо от их финансирования находится приблизительно в пределах 87–100%. Заметное исключение показали респонденты у которых основной финансирующей организацией является AHRC (Совет искусств и гуманитарных наук — прим. переводчика), из которых только 60% пользуются исследовательским ПО.
Расхождения в результатах начинают проявляться тогда, когда мы смотрим на респондентов которые пишут свои собственные программы. Эти респонденты могут быть разделены на три группы. Лидерами являются исследователи, финансируемые STFC (Совет научных и технологических инфраструктур — прим. переводчика), NERC (Совет исследований окружающей среды — прим. переводчика) и EPSRC, среди которых, соответственно, 93%, 90% и 79% разрабатывают собственное исследовательское ПО. Следующая группа по разработке ПО находится приблизительно на уровне 50%. Эта группа включает в себя исследователей, которые финансируются из других источников. Третья группа состоит из респондентов, финансируемых Национальным институтом исследований здоровья (31%), индустриальными организациями (17%) и AHRC (10%).
Вероятно, не является неожиданностью то, что процент исследователей, которые получили тренинг в разработке ПО, в некоторой форме следует за процентом тех кто разрабатывает ПО. Вариация между двумя этими категориями находится в пределах ± 10%.
Многие исследователи считают, что включение расходов на разработку программного обеспечения в предложение проекта сделает это предложение слабей. Мы получили отзыв от исследовательских советов который говорит о том, что это не так — это то что в чём мы стремимся убедить исследователей. Но мы можем сдаться в этом стремлении.Когда мы спросили тех исследователей, которые ответственны за написание предложений проектов, о том включали ли они расходы на разработку ПО, то 22% ответили что они это делали, 57% ответили что они этого не делали и 20% ответили что они даже не думали, что разработка ПО может быть частью бюджета! (заметим что ошибки округления приводят к тому что сумма процентов этих групп равна 99%.)
36% респондентов были женского пола и 62% — мужского. Остаток ушёл к тем кто выбрал свой пол как «другой», «предпочитаю не сообщать» или оставил этот вопрос без ответа (ответ на вопрос о поле респондентов был не обязательным).Разницы в проценте использования ПО между респондентами мужского и женского полов нет — 92% для обоих групп. Это бодрящие новости!
Хотя нет разницы в использовании исследовательского ПО среди представителей разных полов, существует огромная разница как только дело касается его разработки. 70% респондентов мужского пола разрабатывает своё исследовательское ПО, в то время как только 30% респондентов женского пола делают это.Это доминирование мужского пола в разработке отражается, как можно ожидать, в объёме тренинга. Только 39% респондентов женского пола получили тренинг в разработке программного обеспечения по сравнению с 63% у респондентов мужского пола.
Есть разница, хотя и не существенная, тех случаев когда дело касается просто использования исследовательского ПО: 88% пользователей операционной системы семейства Windows так же являются пользователями исследовательского ПО, по сравнению с 93% у ОС X и заметными 98% у Linux.Когда дело касается разработки исследовательского ПО, то разница становится заметной. Только 41% пользователей ОС Windows разрабатывают исследовательское ПО, что снова слегла позади числа пользователей ОС X с их 53%. Пользователи ОС семейства Linux сами по себе: 90% из них разрабатывают свое собственное исследовательское ПО.
Тут есть потенциально важный урок для общества разработчиков ПО. Если вы хотите чтобы пользователи пользовались вашим ПО, то лучше быть уверенным что оно работает в ОС X и Windows, так же как и в «родной» среде Linux.
Нам нужны были результаты, которые могли бы представлять общество исследователей. Так что мы провели исследование и контактировали с тысячью случайным образом отобранных исследователей в каждом из 15 университетов Группы Рассела. После 15000 приглашений для проведения исследования мы получили 417 ответов, что представляет собой 3%, что в свою очередь вполне нормально для «слепого» исследования.Мы спросили респондентов об «исследовательском ПО», которое было определённо следующим образом:
Программное обеспечение которое используется для генерации, обработки или анализа результатов которые вы планируете поместить в публикации (в журнале, конференционной публикации, монографии, книге или тезисах). Исследовательское программное обеспечение может быть чем угодно от нескольких строк кода, написанного самостоятельно, до профессионально разработанного программного пакета программ. Программное обеспечение которое не генерирует, не обрабатывает или не анализирует результаты, такое как текстовые редакторы, или же используемое для поиска в Интернете, не считается исследовательским ПО в рамках этого исследования.
Для сбора ответов респондентов мы использовали Google Forms. В последствии, результаты были перенесены в файлы формата Excel для анализа и загружены на Google Drive для дальнейшего распространения.