Что такое скалярное значение в программировании

Что это значит, когда данные скалярные?

Я не знаю, что именно означает скаляр, но я пытаюсь понять, правильно ли я думаю об этом. Относится ли скаляр к произвольности, когда тип данных может быть любого типа, или система не может заранее знать, что это за данные.

Дополнительная мнемоника к великому ответу Карла Билефельдта:

Простой способ думать об этом, «это может быть в масштабе?»

Целое число может быть в масштабе.

Реальное число может быть в масштабе.

Символ, логическое значение или десятичная дробь с фиксированной точностью могут быть в масштабе. Даже строка может быть в масштабе (мы используем такие в сортировке).

Строка базы данных не может быть в масштабе. Комплексное число не может быть в масштабе. Объект, представляющий сообщение электронной почты, не может быть в масштабе. Массив, вектор или матрица не могут быть в масштабе.

Как и в случае со многими терминами в вычислительной технике; Происхождение слова связано с более физическими свойствами. Термин Скалярный является относительно старым в вычислительной технике. Его определение в наши дни менее строгое. Когда вы храните данные в памяти компьютера, эти данные могут помещаться в один адрес (1 байт *) или нет. Когда это было, это называлось скалярным, когда это не называлось составным. Главным образом потому, что процессоры могут обрабатывать только один адрес / часть данных (= 1 байт) за раз. Как заявлено @Karl Bielefeldt; термин действительно был взят из алгебры.

Мы называем строку строкой, потому что это строка символов. Символ является / был скаляром, а строка является / была составной. Хранение 1 части данных (данных) по нескольким адресам несколько размыло линию. Подумайте об этом так: когда процессор мог обрабатывать данные в одной инструкции, это было скалярно.

(* Я говорю 1 байт, чтобы прояснить ситуацию, но технически я говорю о тех днях, когда 6 бит чаще использовались, например, на перфокартах, а затем на магнитных полосах)

Отказ от ответственности: я не могу найти какие-либо ссылки на это в Интернете, я получил информацию в школе и из старых книг, среди которых (я думаю): математические таблицы и другие пособия для вычислений с 1944 года. При этом моя память не то, что раньше, так что если кто-то может изменить / подтвердить или опровергнуть мой ответ, было бы неплохо.

Однако обратите внимание, что большой очень сложный тип данных такого рода, который также может быть сведен и представлен в 8-битных байтах компьютерной памяти, также может быть представлен как одно очень длинное / большое двоичное скалярное число. Тьюринг использовал эту технику для представления целых компьютерных программ как одного скалярного числа.

Источник

Новый PHP, часть 2: Scalar types

В нашей предыдущей статье мы говорили о преимуществах системы типов PHP 7, и в частности, о новой поддержке типизированных возвращаемых значений. Что само по себе является не только большим подспорьем в поддержке кода, но делает для PHP большой шаг вперед.

Также как и типы возвращаемых значений, скаляры увеличивают ясность кода, дают возможность поймать больше ошибок на раннем этапе. Что, в свою очередь, повышает надежность кода.

Изменения коснулись некоторых методов, отдающих строку или число. Даже сделав такой простой шаг, мы уже получили некоторые преимущества.

Явное указание типов также открывает двери к более мощным инструментам. Программы — либо сам PHP, либо инструменты для анализа от третьих лиц — могут изучать исходный код, находя возможные ошибки или возможности оптимизации на основании полученной информации.

Например, мы можем проверить, что следующий код является некорректным и всегда будет падать, даже без его запуска:

Этот процесс называется «статический анализ», и он является невероятно мощным способом оценки программ с целью поиска и исправления ошибок. Этому немного мешает стандартная слабая типизация PHP. Передача целого числа в функцию, которая ожидает строку, или строку в функцию, ожидающую целое, все это продолжает работать и PHP молча конвертирует примитивы между собой, также как и всегда. Что делает статический анализ, нами или с помощью утилит, менее полезным.

Введение режима строгой типизации является краеугольным камнем новой системы типов PHP 7.

Авто-преобразование имеет смысл, в тех случаях, когда практически все входные данные передаются как строки (из базы данных или http-запросы), но в то же время оно ограничивает полезность проверки типов. Как раз для этого в PHP 7 предлагается strict_types режим. Его использование является несколько тонким и неочевидным, но при должном понимании разработчик получает невероятно мощный инструмент.

Чтобы включить режим строгой типизации, добавьте объявление в начало файла, вот так:

Другими словами, методы и функции будут затронуты строгой типизацией только, если они вызваны в соответствующе задекларированном файле. Код в любой другой части проекта не будет задет. Желание разработчиков библиотек следовать принципу строгой типизации не будет влиять именно на ваш код, только на их.

При слабой типизации это означает, что в Бостоне адрес будет интерпретироваться не как zip-код 02113, а как целое число 02113, что по основанию 10 будет: 1099, вот его-то PHP и переведет в почтовый индекс «1099». Поверьте мне, жители Бостона ненавидят это. Такую ошибку в итоге можно отловить где-то в базе или при валидации, когда код принудительно заставит ввести именно шестизначное число, но в тот момент вы и понятия не будете иметь откуда пришло 1099. Может быть позднее, часов через 8 отладки, будет понятно.

Вместо этого, мы переключим EntityRespository.php в strict-режим и сразу же поймаем несоответствие типов. Если запустить код, то получим вполне конкретные ошибки, которые скажут нам точные строки, где их искать. А хорошие утилиты (либо IDE) могут поймать их еще до запуска!

Когда же мы должны использовать строгую типизацию? Мой ответ прост: как можно чаще. Скалярная типизация, типы возвращаемых значений и strict-mode предлагают огромные преимущества для дебаггинга и поддержки кода. Все они должны использоваться максимально, и как результат, будет более надежный, поддерживаемый и безглючный код.

Будем надеяться, что переход на PHP 7 будет намного быстрее, чем как это было с PHP 5. Это действительно стоит того. Одной из главных причин как раз и является расширенная система типов, дающая нам возможность сделать код более самодокументированны и более понятным друг другу и нашим инструментам. В результате получится намного меньше «хммм, я даже и не знаю что с этим делать» моментов, чем когда-либо прежде.

Источник

Скалярные функции среды CLR

Требования к скалярным функциям среды CLR

Определяемые пользователем скалярные функции могут быть детерминированными или недетерминированными. Детерминированная функция всегда возвращает один и тот же результат при вызове с конкретным набором входных параметров. Недетерминированная функция может возвращать разные результаты при вызове с конкретным набором входных параметров.

Не следует помечать функцию как детерминированную, если она не всегда выдает одинаковые выходные значения при передаче одинаковых входных значений и при одинаковом состоянии базы данных. Не следует определять функцию как детерминированную, если в действительности она таковой не является. Это может привести к искажению индексированных представлений и вычисляемых столбцов. Определить функцию как детерминированную можно, задав для свойства IsDeterministic значение true.

Параметры, возвращающие табличные значения

Пример скалярной функции среды CLR

Ниже приводится простой пример скалярной функции, получающей доступ к данным и возвращающей целочисленное значение.

После сохранения в файле с именем FirstUdf.cs этот код можно скомпилировать в сборку следующим образом:

/t:library указывает, что результатом компиляции должна быть библиотека, а не исполняемый объект. Исполняемые объекты нельзя регистрировать в SQL Server.

Ниже приведены запрос Transact-SQL и образец вызова для регистрации сборки и определяемой пользователем функции.

Обратите внимание, что имя функции в Transact-SQL не обязательно должно соответствовать имени общего статического целевого метода.

Источник

Горбачев Л.И. Основы программирования в среде Turbo Pascal.

Типы данных.

Понятие тип связано с фиксированным набором данных. Переменная относится к определенному типу, если ей можно присвоить данные, принадлежащие к набору, определяющему этот тип. В языке Турбо-Паскаль необходимо явное определение типа каждой из переменных в программе.

Например, значения переменной, равные 1 или 10 относятся к целочисленному типу, их можно складывать, умножать и выполнять другие арифметические операции. В языке Паскаль для описания типа в общем случае используется зарезервированное слово Type.

Формат: type имя_типа = значение_типа;

Все типы данных разделяются на две группы: скалярные (простые) и структурированные (составные). Скалярные типы в свою очередь подразделяются на стандартные и пользовательские. Стандартные типы данных предлагаются пользователям разработчиками системы Turbo Pascal.

К стандартным скалярным типам относятся целочисленные, вещественные, символьные, булевские типы данных и указатели.

В десятичной системе числа с фиксированной точкой записываются по обычным правилам арифметики. Целая часть от дробной отделяется десятичной точкой. Если десятичная точка отсутствует, число считается целым. Перед числом может находиться знак «+» или «-«. Если знак отсутствует, по умолчанию число считается положительным.

Структурированные типы в своей основе имеют один или несколько скалярных типов данных. К структурированным типам относятся строки, массивы, множества, записи, файлы и данные процедурного типа и типа object.

Набор основных типов переменных Турбо-Паскаля можно представить в виде следующей схемы:

5.1. Скалярные типы данных.

5.1.1. Целочисленный тип.

Целочисленные типы данных представляют собой значения, которые могут использоваться в арифметических выражениях и занимать память от 1 до 4 байт.

Тип	Наименование	Допустимые значения	Занимаемая память
shortint	короткое целое	-128..127	1 байт
byte	байт	0..255	1 байт
integer	целое	-32768..32767	2 байта
word	слово	0..65535	2 байта
longint	длинное целое	-210^9..210^9	4 байта

Пример: var X1, X2 : byte;
Y1 : word;
K, L : integer;

5.1.2. Вещественный тип.

Вещественные типы данных представляют собой вещественные значения, которые используются в арифметических выражениях. Допускается представление вещественных значений как в виде с плавающей, так и с фиксированной точкой.

Тип	Наименование	Допустимые значения	Число значащих цифр	Занимаемая память
real	вещественный	10^-38-10^38	11-12	6 байт
single	с одинарной точностью	10^-38-10^38	7-8	4 байта
double	с двойной точностью	10^-308-10^308	15-16	8 байт
extended	с повышенной точностью	10^-4931-10^4931	19-20	10 байт
comp	сложный(длиное целое)	-910^18-910^18	19-20	8 байт

5.1.3. Символьный тип.

Тип	Диапазон	Требуемая память
Char	Кодовая таблица ПЭВМ	1 байт

Пример: var Ch : char;
Let, Znak : char;

5.1.4. Логический (булевский) тип.

Булевский тип представлен двумя значениями: True (истина) и False (ложь). Он широко применяется в логических выражениях и выражениях отношения.

Тип	Диапазон	Требуемая память
boolean	True, False	1 байт

Пример: var Flag1, Flag2 : boolean;

5.2. Пользовательские типы.

Кроме стандартных типов данных, Паскаль поддерживает скалярные типы, определенные самим пользователем. К ним относятся перечисляемый и интервальный типы.

Данные этих типов занимают в памяти один байт, поэтому любой пользовательский тип не может содержать более 256 элементов. Их применение значительно улучшает наглядность программы, делает более легким поиск ошибок и экономит память.

5.2.1. Перечисляемый тип.

Перечисляемый тип задается непосредственно перечислением всех значений, которые может принимать переменная данного типа. Отдельные значения указываются через запятую, а весь список заключается в круглые скобки.

Переменная типа «перечисление» задается перечислением значений, которые она может принимать. Описание этих переменных имеет вид:
1) type имя_типа = (список_значений);
var имя_переменной = имя_типа;
или
2) var имя_переменной: (список_значений);

Пример: type God = (Zima, Vesna, Leto, Osen); var A1, A2: God;
или
var A1, A2: (Zima, Vesna, Leto, Osen);

Третий тип перечисления анонимный ( не имеет имени) и задается перечислением значений в разделе Var. Season является переменной этого типа и может принимать значения Winter, Spring, Summer и Autumn. Таким образом может быть задан любой тип, но это не всегда приемлемо, так как первый способ более понятен и больше соответствует характеру языка Паскаль.
Пример: Для разработки программы управления уличным светофором можно использовать описание света, которое принимает три значения: красный, желтый и зеленый. Это можно описать так:
type Lights = (Red, Yellow, Green);
var Color: Lights;

Имена из списка перечисляемого типа (внутри круглых скобок) являются константами соответствующего типа перечисления и соответствуют обычным правилам для констант. Эти идентификаторы должны быть уникальны в пределах блока; недопустимы описания двух и более перечислимых типов с совпадающими константами. Например, описания вида:
type Color1 = (Red, Yellow, Blue);
Color2 = (Green, Blue, Gray);
являются некорректными из-за повторного использования идентификатора Blue.

Выражения и константы перечисляемого типа допустимы для использования в операторе CASE. Операция отношения и логические операции допустимы для значений перечисления одного и того же типа. Упорядочение осуществляется по номеру элемента в описании типа.

Например, будет истинно выражение Winter

В отличии от данных других типов, Паскаль не поддерживает операции ввода-вывода значений пользовательского перечисляемого типа. При необходимости программист сам должен организовать ввод-вывод таких данных.

Для работы с данными перечисляемого типа в языке Паскаль предназначены стандартные функции Succ, Pred, Ord.

Функция	Тип результата	Результат выполнения функции
Succ(X)	порядковый тип X	следующий за X в описании типа (если таковой существует)
Pred(X)	порядковый тип X	предшествующий X в описании типа (если таковой существует)
Ord(X)	integer	номер X в описании типа (начиная с 0

5.2.2. Интервальный тип.

Интервальный тип позволяет задавать две константы, определяющие границы диапазона значений для данной переменной. Компилятор при каждой операции с переменной интервального типа генерирует подпрограммы проверки, определяющие, остается ли значение переменной внутри установленного для нее диапазона. Обе константы должны принадлежать одному из стандартных типов (напомним, что тип real здесь недопустим). Значение первой константы должно быть обязательно меньше значения второй.

Для переменных ограниченного (диапазонного) типа указывается подмножество значений, которые они могут принимать. Описание этих переменных имеет вид:
1) type имя_типа = Min..Max;
var имя_переменной: имя_типа;
или
2) var имя_переменной: Min..Max;

В этом примере переменные WorkDay, BolnDay имеют тип DayMonth и могут принимать любые значения из диапазона 1..31. Выход из диапазона вызывает программное прерывание.

5.3. Структурированные типы данных.

Структурированные типы данных определяют упорядоченную совокупность скалярных переменных и характеризуются типом своих компонентов. В языке Паскаль допускаются следующие структурированные типы данных: строки, массивы, множества, записи, файлы, указатели, процедурные типы и объекты. Все они требуют отдельного рассмотрения и будут подробно описаны (кроме объектов) ниже.

Гостевая

Главная

Новости

TurboPascal

Учебное пособие

Лекции

Исходники

Главная

Новости

TurboPascal

Учебное пособие

Лекции

Исходники

Математика

Книги

Лекции

Шпоры

ЦТ и ЕГЭ

Физика

Источник

Наиболее точное скалярное произведение векторов типа double. Вычисление значения полинома

В прошлой статье речь шла о том, как можно сложить массив из чисел типа double наиболее точно, то есть получить такую сумму, как если бы мы выполняли вычисления в рамках арифметики с бесконечной точностью, а затем один раз округлили бы результат. Был показан алгоритм, который эквивалентен применению типа данных double-double, в котором сложение происходит сразу в двух переменных: основная сумма и хвостик-погрешность. Опытные читатели сразу догадались, что сложение хвостиков-погрешностей также допускает по отношению к себе рекурсивное применение того же алгоритма, что приводит не к удвоенной, а к утроенной точности, и вообще, можно организовать каскад сложений произвольного размера, получая любую наперёд заданную точность расчётов, поэтому фактически в прошлой статье была показана предпосылка к так называемой «дробной длинной арифметике». Опытный программист без труда разберётся как её реализовать, ну а я обещал дать аналогичные фундаментальные основы для скалярного произведения и вычисления полинома в точке. Поскольку все базовые вводные слова уже были сказаны в двух предшествующих статьях, в этой будет меньше «воды» и «лишних», по мнению опытных математиков, сведений. Прошу под кат.

Как обычно, видео-презентация полностью дублирует содержание статьи, и создана для удобства тех посетителей Хабра, кому голос с иллюстрациями воспринять проще чем текст без таковых.

Умножение двух чисел без потери точности (ну… почти)

О сложении мы знаем уже достаточно: с помощью функции two_sum можно сложить N чисел наиболее точно, дело осталось за малым: научиться перемножать два числа типа double так, чтобы не терять отбрасываемый при округлении «хвостик», сохраняя его в отдельной переменной. Если в случае сложения сделать это можно очень просто при любом раскладе, лишь бы промежуточная сумма не переполнялась (кто не читал: «Сложение двух чисел с плавающей запятой без потери точности»), то в случае умножения есть дополнительное ограничение.

Обозначим через минимальную экспоненту вашей системы чисел с плавающей запятой, в рамках которой выполняется умножение (для float: −126, для double: −1022), буквой обозначим количество битов мантиссы с учётом скрытой единицы (24 для float и 53 для double). Пусть и — экспоненты наших исходных чисел и , тогда требуется, чтобы было выполнено условие:

Если данное условие не выполняется, то могут возникнуть случаи, когда нельзя представить в виде суммы , где и . Указанное неравенство является сложным способом сказать простую фразу: «хвостик» не должен быть денормализованным. И это вполне понятно: когда мы перемножаем два числа, получаем удвоенное количество битов, которые гарантированно влезают в две переменные того же типа данных. Если же одна из этих переменных попадает в денормализованный диапазон, происходит битовый сдвиг мантиссы с потерей младших битов. И кроме переполнения это единственная ситуация, при которой произведение двух чисел нельзя точно представить в форме суммы двух чисел того же типа.

Если указанное условие выполнено, то с помощью инструкции FMA (Fused Multiply-Add) точное умножение двух чисел выполняется следующим алгоритмом:

Результатом работы функции будет пара чисел , такая, что является ближайшим к числом, а — хвостиком-погрешностью, причём в точности. Разумеется, по ходу расчётов не должно произойти переполнения, за этим придётся следить отдельно: нужно оставаться в рамках условия .

Если операция FMA для вас недоступна, то ситуация сильно усложняется. Желаемое произведение можно получить путём разбиения исходных переменных и на две части примерно посередине так, чтобы старшая часть операндов (ah и bh) содержала половину старших битов, а младшая (al и bl) — половину младших. Далее нужные операции выполняются именно с этими половинками, в общей сложности алгоритм потребует 17 операций сложения и умножения. Данный трюк в чём-то аналогичен известному алгоритмическому трюку для вычисления произведения двух целых чисел с сохранением результата в удвоенном типе данных (кто не знал, читайте Г. Уоррен «Алгоритмические трюки для программистов», в издании 2014 года это раздел 8.2). Нижеследующий алгоритм написан мною по мотивам книги Jean-Michel Muller, “Handbook of floating-point arithmetic”, также как и остальная часть этой статьи.

Данный алгоритм для двоичных типов данных из Стандарта IEEE-754 работает всегда, для десятичных типов он будет работать только если количество цифр мантиссы чётно, то для есть для decimal32 он может давать ошибочный результат. Если же вы изобретаете свой тип данных с плавающей запятой, читайте полное условие теоремы 4.8 в упомянутой выше книге в разделе 4.4.2.2 “Dekker’s multiplication algorithm”. Там же, но разделом ранее разъясняется как подбирать магическую константу для правильного разбиения в функции split. В двоичной системе она подбирается равной 2 s +1, при этом младшая часть lo будет содержать s битов, а старшая — все остальные.

Вычисление скалярного произведения

Итак, теперь мы умеем умножать два числа точно. Стряпаем сумму произведений по образу и подобию предыдущей статьи. Данный алгоритм назван именами трёх авторов Ogita—Rump—Oishi:

Понятно, что two_prod нужно заменить на two_prod_s, если вам недоступна FMA.

Опытный программист видит здесь в строке с комментарием «собираем хвостики» возможность каскадного применения функции two_sum, что даёт увеличение точности, но я оставлю это опытному программисту на его усмотрение.

Помимо этой версии скалярного произведения есть ещё две наивные функции, разъяснение которых в тексте статьи будет моветоном.

Naive	Naive FMA	Ogita—Rump—Oishi
U[1, 2)	95.31 275	95.36 276
±U[1, 2)	441.61 6878	432.99 7489
U[1e-10, 1e10)	2478.61 2740	2478.55 2739
±U[1e-10, 1e10)	392.50 11893	394.86 12126
exp[2]	183.70 513	183.65 512
±exp[2]	329.21 5962	347.31 7251
N(0, 1)	1554.07 109700	1408.30 95896

Ожидаемо, что алгоритм с применением double-double сработал безошибочно, и так будет происходить на всех типичных бытовых задачах. Таблица не требует особых комментариев кроме одного: наивный алгоритм с FMA может давать менее точный результат, чем ещё более наивный алгоритм с двумя округлениями на каждом шаге. При этом ДА, я выполнил дизассемблирование и убедился, что в этом наивном методе компилятор не всунул FMA в качестве оптимизации. Вообще говоря, он не имеет на это права без моего разрешения, но всё же осторожность не помешает.

Вычисление значения полинома

Мы умеем точно умножать два числа и складывать целые массивы, а значит нам под силу применить это знание для любых алгоритмов, которые основаны на этих двух операциях. Например, в качестве бонуса рассмотрим вычисление значения полинома в заданной точке.

Когда мы применяем схему Горнера, то по сути имеем похожий по структуре цикл, в теле которого также одно умножение и сложение, поэтому никаких дополнительных пояснений к построению алгоритма не требуется, просто пишем код. Предполагается, что коэффициенты полинома записаны от старшего к младшему, а степень полинома на единицу меньше количества элементов в массиве A.

Поскольку значение полинома на случайных тестах очень быстро возрастает и создаёт трудности для точного расчёта (эталонное значение ответа, как вы знаете, я вычисляю через дроби), для тестов взято ограничение N=100 элементов в массиве. Комментарии снова излишни, кроме одного: здесь применение FMA для наивного расчёта становится оправданным — точность заметно повышается.

Naive	Naive FMA	Graillat—Langlois—Louvet
U[1, 2)	3.15 11	2.67 9
±U[1, 2)	3.96 29	3.03 27
U[1/10, 10)	1.86 11	1.47 7
±U[1/10, 10)	2.20 61	1.29 10
exp[2]	0.59 5	0.46 4
±exp[2]	0.90 30	0.71 6
N(0, 1)	0.90 30	0.71 6

Считаю, что базовые представления об увеличении точности при использовании арифметики с плавающей запятой описаны в полной мере, если принять во внимание научно-популярный характер изложения и бытовую сферу применения описанных знаний. Напомню, что у меня не было цели погружаться именно в глубоко-научную сферу, для этого существуют монографии. Поэтому данную серию я завершаю, но что будет дальше — сказать не могу, пожалуйста, ждите.

Одна из лучших наград автору — успешное применение описанных им знаний на практике для всеобщей пользы. Благодарю за внимание!

Список источников

[1] Разделы 4.4.2.2 и 5.4-5.5 книги Jean-Michel Muller, “Handbook of floating-point arithmetic”, 2018.

[2] Раздел 8.2 книги (по поводу умножения целых чисел) Генри С. Уоррен мл. «Алгоритмические трюки для программистов», 2014.

Источник

Что это значит, когда данные скалярные?

Новый PHP, часть 2: Scalar types

Скалярные функции среды CLR

Требования к скалярным функциям среды CLR

Параметры, возвращающие табличные значения

Пример скалярной функции среды CLR